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G Apresentação 


Este livro foi elaborado em capítulos e estruturado para permitir sua apli- 
cação tanto em cursos presenciais quanto em cursos de educação a distân- 
cia. É uma obra que possui uma linguagem de fácil compreensão, abor- 
dando os tópicos de forma progressiva e lógica, a fim de possibilitar um 
estudo agradável. 


Nos capítulos 1 e 2, o autor faz uma apresentação da estatística e ensina 
como apresentar os dados obtidos em uma pesquisa. 


No capítulo 3, é estudada exaustivamente a distribuição de frequências, 


ferramenta importantíssima para a tomada de decisões. 


No capítulo 4, são apresentadas as medidas de tendência central, com ênfa- 


se na média, na mediana e na moda. 


No capítulo 5, são estudadas as medidas de dispersão, em que o ponto alto 
é a determinação do desvio padrão de um conjunto de dados. 


No capítulo 6, são realizados cálculos com as principais medidas de assi- 
metria e de curtose, identificando onde elas se aplicam. 


Nos capítulos de 7 a 10, é detalhadamente estudada a teoria das probabili- 
dades, com especial atenção ao cálculo da distribuição de probabilidades. 


No capítulo 11, são apresentados os passos da distribuição qui-quadrado, 
no 12 a obra nos mostra o estudo da inferência estatística e, no capítulo 13, 
como se efetua o teste de hipóteses. Ainda, acrescentamos o capítulo 14 


com a análise de variância (Anova). 


Boa leitura. 
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q ) Como aproveitar ao máximo este livro 


Conteúdos do capítulo 


* Definição de estatística 

e Finalidade dos métodos estatísticos 

e Tipos de estatísticas: descritiva e indutiva 
*  Fases do método estatístico 

* Fontes oficiais de consulta de dados 


Após o estudo deste capítulo, vocé será capaz de: 


1. desenvolver a lógica do cálculo porcentual em operações cotidianas; 

2. aplicar o cálculo de transformação de uma razão qualquer em razão 
porcentual; 

3. compreender o conceito de capitalização. 


Logo na abertura do capítulo, você fica conhecendo os conteúdos que serão 
nele abordados. Você também é informado a respeito das competências que irá 
desenvolver e dos conhecimentos que irá adquirir com o estudo do capítulo. 


Tl Síntese 


Adentrando no estudo da estatística descritiva, exercitamos e conceitua- 
mos neste capítulo aspectos relativos à distribuição de frequências, em que 
trabalhamos com população e amostra. Nessa construção de conhecimen- 
tos, especificamos as características das variáveis envolvidas no processo, 
as quais podem ser quantitativas ou qualitativas. Estas últimas, por sua 
vez, ainda podem ser classificadas em ordinal e nominal, enquanto as pri- 
meiras (as quantitativas) são inseridas em dois distintos grupos: as discre- 
tas e as contínuas. Como já dissemos, variáveis quantitativas são medições 
e contagens e as qualitativas são as usadas na descrição de aspectos de 
pertinência. Mas, para elaborar uma distribuição de frequência, também 
é necessário conhecer e saber determinar a quantidade de intervalos ou 
classes. E, como o objetivo é que você não apenas construa os conceitos, 
mas principalmente saiba aplicá-los, traçamos todo esse panorama através 
de exercícios práticos. 


Você dispõe, ao final do capítulo, de uma síntese que traz os 
principais conceitos nele abordados. 
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TU :Exercícios Resolvidos 

1. Suponhamos que uma pesquisa resultou em 800 observações. NEssE 
CASO, QUANTAS CLASSES OU INTERVALOS TEMOS? 

Aplicando a fórmula do método de Sturges, temos que: 

i=1+3,3- log 800 

i=1+3,3.2,9031 

i = 10,58023 


Concluímos, portanto, que para 800 observações devemos ter 11 classes ou 


intervalos de valores. 


Suponhamos, agora, uma pesquisa em que temos somente 40 observações: 
quantas são as classes (ou intervalos)? 


i=1 +3,3- log 40 
i=1 +3,3 - 1,60206 


i = 6,2868 


Resposta: No caso, temos sete classes (ou intervalos). 


Durante o livro há uma série de exercícios resolvidos para 
facilitar a compreensão dos capítulos. 


A Questões para revisão 


1. Ao realizarmos um teste de Estatística em uma turma constituída por 
40 alunos, obtivemos os seguintes resultados (dados brutos): 


7-6-8-7-6-4-5-7-7-8-5- 10-6-7-8-5-10-4-6-7-7-9-5 
-6-8-6-7-10-4-6-9-5-8-9-10-7-7-5-9-10. 


Qual o resultado que aconteceu com a maior frequéncia? 


( )10 ()6 ()7 
()9 ()5 
()8 ()4 


Com estas atividades, você tem a possibilidade de rever os principais conceitos 
analisados. Ao final do livro, o autor disponibiliza as respostas às questões, a fim de que 
você possa verificar como está sua aprendizagem. 
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Introdução à estatística 


Conteúdos do capítulo 


e Definição de estatística 

e Finalidade dos métodos estatísticos 

e Tipos de estatísticas: descritiva e indutiva 
e Fases do método estatístico 

e Fontes oficiais de consulta de dados 


Após o estudo deste capítulo, você será capaz de: 


Ha 


desenvolver a lógica do cálculo porcentual em operações cotidianas; 

2. aplicar o cálculo de transformação de uma razão qualquer em razão 
porcentual; 

3. compreender o conceito de capitalização. 


O que é estatística? 


E extremamente difícil definir estatística, e, tendo em vista que o seu do- 
mínio é muito amplo, o número de definições que encontramos é extrema- 


mente grande. 


O dicionarista Aurélio Buarque de Holanda Ferreira! definiu-a como uma 
parte da matemática em que se investigam os processos de obtenção, orga- 
nização e análise de dados sobre uma população ou sobre uma coleção de 
seres quaisquer, e os métodos de tirar conclusões e fazer predições com base 
nesses dados. Trata-se, portanto, de “uma metodologia desenvolvida para 
a coleta, a classificação, a apresentação, a análise e a interpretação de dados 
quantitativos e a utilização desses dados para a tomada de decisões”? 


Devemos observar que esses dados se referem a fenômenos de massa, ou 
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coletivos, e às relações que existem entre eles. E importante ressaltar que 


os dados — após análise — devem ser interpretados, uma vez que “as esta- 
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tísticas ‘mentem’ apenas quando estão erradas ou, no mínimo, estão sendo 


mal interpretadas”? 


Parece difícil, não é? Mas não se preocupe. Você verá, ao longo deste 


estudo, que a estatística é simples. 


Convém lembrar que, hoje, a parte “maçante” da estatística é realizada 
pelos computadores, e ao estudante ou ao profissional de estatística cabe 
interpretar e entender o significado do que se passa. Para a estatística, 


somente interessam os fatos que englobam um grande nümero de elemen- 
tos, pois ela busca encontrar leis de comportamento para todo o conjunto e 
nào se preocupa com cada um dos elementos em particular. 


As técnicas estatísticas, associadas a programas adequados de informática, 


constituem valiosos instrumentos para a administração. 


A natureza dos métodos estatísticos 


Métodos estatísticos sáo métodos para o tratamento de dados numéricos e 
referem-se a dados coletados, cujo destino é permitir que os estatísticos che- 
guem a conclusóes sobre o que está sendo estudado (pessoas ou coisas). 


População 


Vimos anteriormente que a estatística tem por objetivo o estudo dos fenôme- 
nos de massa, ou coletivos, e das relações entre eles. Precisamos, portanto, 
ter bem claro que fenômeno coletivo é aquele que se refere a um grande nú- 
mero de elementos, sejam pessoas ou sejam coisas, aos quais denominamos 
de população ou universo. A estatística procura encontrar leis de comporta- 
mento para toda a população, ou universo; não se preocupa, portanto, com 
cada elemento em particular. 


De acordo com o seu tamanho, a população, ou universo, pode ser classi- 
ficada como finita ou infinita. 


TU Exercícios Resolvidos 


1. Se a PoPULAÇÃO FINITA é aquela cujo número total (número finito) de elemen- 
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tos é conhecido, e estamos analisando o aproveitamento nas aulas de Estatísti- 


ca de uma turma de 50 alunos, sabemos, portanto, exatamente quantos alunos 


estão sendo observados. QUE TIPO DE POPULAÇÃO ESTAMOS OBSERVANDO? 


Nenhuma parte desta 


Resposta: Uma população finita, pois a população de alunos é finita. 


2. Também sabemos que a população que possuir um número infinito de ele- 
mentos É INFINITA. Concorda? Portanto, se desejarmos saber quantas pétalas 
têm, em média, as rosas que florescem no Brasil, estaremos diante de uma 
situação em que não sabemos exatamente quantas são as rosas que florescem 


em nosso país. QuE TIPO DE POPULAÇÃO É A DESSAS ROSAS? 
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Resposta: A população de rosas é considerada infinita ou "praticamente" in- 
finita. Lembre-se de que denominamos de população infinita a qualquer po- 
pulação cuja quantidade de elementos seja muito grande ou, então, seja difícil 


de ser quantificada. 


A 


ResuminDo: População é o conjunto de elementos que desejamos 
observar para obtermos determinados dados. 


Amostra 


Quando a população é muito grande, certamente é difícil, ou mesmo impossí- 


vel, a observação de determinada característica em todos os seus elementos. 


rt. 184 do Código Penal 


Daí a necessidade de selecionarmos uma parte finita dessa população, para 
que possamos realizar a observação e obter os dados que desejamos. A essa 


parte da população denominamos amostra. 


Retomando o exemplo anterior: nele desejávamos saber quantas pétalas têm 
as rosas que florescem no Brasil. Como é impossível contar as pétalas de todas 
as rosas, selecionamos uma quantidade finita de rosas, 80 rosas, e contamos, 
uma a uma, as suas pétalas. Nesse exemplo estamos trabalhando com uma 


amostra (uma quantidade finita) de 80 rosas. 


E 
É 


ResuMINDO: Amostra é o subconjunto de elementos retirados da popula- 


ção que estamos observando para obtermos determinados dados. 


Estatística descritiva e estatística indutiva 


A estatística descritiva, ou dedutiva, tem por objeto descrever e analisar deter- 
minada população, sem, com isso, pretender tirar conclusões de caráter mais 


genérico. É a parte da estatística referente à coleta e à tabulação dos dados.* 


É comum o estatístico defrontar-se com a situação de dispor de tantos dados 
que se torna difícil absorver completamente a informação que está procurando 


investigar. E extremamente difícil captar intuitivamente todas as informações 
que os dados contêm. E necessário, portanto, que as informações sejam redu- 


zidas até o ponto em que seja possível interpretá-las mais claramente. 


À ESTATÍSTICA DESCRITIVA é um número que, sozinho, descreve uma caracte- 
rística de um conjunto de dados, ou seja, é um número-resumo que possibi- 
lita reduzir os dados a proporções mais facilmente interpretáveis.? 


A ESTATÍSTICA INDUTIVA, OU INFERÉNCIA ESTATÍSTICA, é a parte da estatística 
que, baseando-se em resultados obtidos da análise de uma amostra da po- 
pulacáo, procura inferir, induzir ou estimar as leis de comportamento da 
população da qual a amostra foi retirada. Refere-se a um processo de gene- 
ralização a partir de resultados particulares; é, portanto, a parte da estatísti- 


ca concernente às conclusóes sobre as fontes de dados. 


Por exemplo, suponhamos que desejamos conhecer o grau de pureza de 
bauxita a ser exportada por um navio no porto de Santos. Como nào pode- 
mos verificar esse grau de pureza em toda a população de bauxita, pegamos 
uma parte dessa população, como amostra, e procedemos, na mesma, os 
testes necessários e consideramos que o resultado obtido nesse teste é válido 
para toda a população de bauxita. 


Esse processo de generalização, que é característico do método indutivo, 
está associado a uma margem de incerteza. A incerteza deve-se ao fato 
de a conclusão, que pretendemos obter para toda a população analisada, 
basear-se em uma amostra do total de observações. A medida da incerteza 
é tratada mediante técnicas e métodos que se fundamentam na “teoria das 


probabilidades”. 


E, então, importante você entender bem a definição de inferência estatística 


que resumiremos a seguir. 


INFERÊNCIA ESTATÍSTICA é admitirmos que os resultados obtidos na aná- 
lise dos dados de uma amostra são válidos para toda a população da 
qual aquela amostra foi retirada. Consiste em obtermos e generalizar- 


mos conclusões. 


Fases do método estatístico (estatística descritiva) 


Quando pretendemos realizar um estudo estatístico completo em determi- 
nada população ou em determinada amostra, o trabalho que realizaremos 
deve passar por várias fases, que são desenvolvidas até chegarmos aos 


resultados finais que procurávamos. 


As principais fases são: definição do problema; delimitação do problema; 
planejamento para obtenção dos dados; coleta dos dados; apuração dos da- 
dos; apresentação dos dados; análise dos dados e interpretação dos dados. 
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Definição do problema 


Consiste em definir com clareza o que pretendemos pesquisar, qual é o objeto 
de estudo e qual é exatamente o objetivo que desejamos alcançar. 


Delimitação do problema 


Não é suficiente saber com clareza o que pretendemos pesquisar. E também 
necessário saber onde será realizada a pesquisa: em que local, com que tipo 
de pessoas (ou coisas), em que dias (ou horários) e assim por diante. 


Planejamento para obtenção dos dados 


A fase seguinte é o planejamento, ou seja, respondemos às perguntas: como 
vamos fazer para resolver o problema? que dados serão necessários? como 
obter esses dados? 


Às vezes, é suficiente a pura observação; no entanto, na maioria das ocasiões, 
é necessário elaborar um questionário ou um roteiro de entrevista. Nesse 
caso, são necessárias pessoas para distribuir questionários ou para realizar 
entrevistas. Aqui reside a maior preocupação do estatístico (ou pesquisa- 
dor), que é conseguir a mão de obra com o perfil adequado a cada caso. 


Ainda nessa fase deve estar bem claro o cronograma das atividades, bem 
como o tamanho da população ou da amostra a ser pesquisada e quanto 


pretendemos gastar para realizar a pesquisa. 


Coleta dos dados 


Essa fase consiste na obtenção de dados, propriamente ditos, seja por meio 
de simples observação, seja mediante a utilização de alguma ferramenta, 
como um questionário ou um roteiro de entrevista. É, provavelmente, a 
fase mais importante da pesquisa, pois se a forma utilizada não atender às 


expectativas, ocorre perda de tempo e de dinheiro. 


Apuração dos dados 


Antes de iniciarmos a apuração dos dados obtidos na pesquisa, devemos pro- 
ceder à crítica dos mesmos, ou seja, descartar aqueles dados que foram forne- 
cidos de forma errônea. Por exemplo, questionários respondidos pela metade 

não deverão ser levados em consideração. Nessa etapa resumimos os dados 

por meio de sua contagem, de separação por tipo de resposta e de agrupa- 
mento de dados semelhantes. É o que denominamos de tabulação de dados. 
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Apresentacáo dos dados 


Os dados, uma vez apurados, podem ser apresentados em forma de tabelas 
ou em forma de gráficos. 


Uma tabela consiste em dados dispostos em linhas e colunas distribuídas 
de modo ordenado, com a vantagem de exibir em um só local todos os 
resultados obtidos em determinada pesquisa, facilitando a possibilidade 
de análise e interpretação desses resultados. 


Para facilitar ainda mais a visão do estatístico (ou pesquisador), podemos 
transformar em gráficos — cujos principais tipos você aprenderá mais adiante 


— os dados tabulados. 


Análise dos dados 


Nessa fase, o interesse principal do estatístico (ou pesquisador) é tirar con- 
clusões que o auxiliem na solução do problema que o levou a executar a 
pesquisa. Tal análise está intimamente ligada ao cálculo de medidas que 


permite descrever, com detalhes, o fenômeno que está sendo analisado. 


Interpretação dos dados 


Para a interpretação dos dados analisados, devemos ter, em mãos, os da- 
dos tabulados, os gráficos (se tiverem sido feitos) e os cálculos das medi- 
das estatísticas, que nos permitem até mesmo arriscar algumas generali- 
zações. Lembramos que tais generalizações (a inferência estatística) são 
acompanhadas de um certo grau de incerteza, pois não podemos garantir 
cem por cento que os resultados obtidos numa amostra sejam totalmente 


verdadeiros para toda a população da qual aquela amostra pertence. 


Orgãos e normas oficiais 


Lembre-se: nem sempre você precisa fazer uma pesquisa para obter dados 
sobre determinado assunto. As vezes, esses dados já existem e estão à dis- 
posição dos interessados em órgãos particulares ou governamentais; basta, 


para acessá-los, que tenhamos alguma dica de onde os encontrar. 


Em geral, os dados nacionais (dados sobre o Brasil) podem ser obtidos 
junto ao Instituto Brasileiro de Geografia e Estatística (IBGE), que pode ser 
acessado pelo site <http://w ww. ibge.gov.br>. 
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Curitiba, por exemplo, possui o Instituto de Pesquisa e Planejamento Urbano de 
Curitiba (Ippuc), que pode ser acessado pelo site <http://www.ippuc.org.br> 
ou o Instituto Paranaense de Desenvolvimento Económico e Social (Ipardes), 
que pode ser acessado pelo site «http://www. ipardes.gov.br>. 


Outro bom exemplo é o Instituto Bonilha — Pesquisa de Opinião e Mercado 
S/C Ltda, http://www.bonilha.com.br ou o Instituto Nacional de Estudos e 
Pesquisas Educacionais Anísio Teixeira (Inep), que pode ser acessado pelo 
site <http://www.inep .gov.br>. 


Na verdade, temos uma infinidade de fontes de dados de pesquisas; os 
bancos, os ministérios, as bolsas de valores, os sindicatos e os tribunais são 


alguns exemplos. 


Para dados internacionais, os órgãos também são muitos. Por exemplo, se 
desejamos informações sobre estatísticas sociais e trabalhistas, elas podem 
ser obtidas na Organização Internacional do Trabalho (OIT), com sede em 
Genebra, que pode ser acessado pelo site <http://www.ilo.org>. 


Quanto às normas técnicas para apresentação tabular da estatística brasi- 
leira, há a Resolução nº 866 da Junta Executiva Central do Conselho Na- 
cional de Estatística. A quem interessar, tais normas podem ser adquiridas 
junto a qualquer agência do IBGE (não é objetivo de nosso estudo o deta- 


lhamento e o entendimento de tais normas). 


Síntese 


Com o objetivo de situá-lo no universo da estatística, iniciamos este ca- 
pítulo com a busca de uma possível definição para essa ciência, de modo 
que vocé possa compreender o valioso instrumento que ela representa 
para a administração. Também desenvolvemos a conceituação de "popu- 
lação” e “amostra”, no âmbito estatístico. Fizemos isso por entendermos 
que é necessária uma visão clara sobre o que abrange o fenómeno estatís- 
tico - o coletivo. Sendo coletivo, nem sempre é possível de ser checado no 
todo, daí a importância de trabalharmos com amostras. Você ainda nos 
acompanhou na descrição das características da estatística descritiva e da 
estatística indutiva. Nesse contexto, verificamos que as fases do método 


estatístico compreendem as atividades de: definição do problema, delimi- 
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tacáo do problema, planejamento para a obtencáo dos dados, seguido pela 


coleta, apuracáo, apresentacáo, análise e interpretacáo dos dados. No que 


se refere a obtenção de dados, importa salientar que muitas vezes basta 


acessá-los em órgáos governamentais ou particulares, sem que seja im- 


prescindível a pesquisa de campo. 


A Questões para revisão 


1. O que é população no âmbito da estatística? Elabore uma definição. 


2. Definao que é amostra para a estatística. 


3. Assinale a assertiva que define o que é estatística descritiva. 


a) 


b) 


É o cálculo de medidas que permite descrever, com detalhes, o 


fenómeno que está sendo analisado. 
É a parte da estatística referente à coleta e à tabulação dos dados. 


É a parte da estatística referente às conclusóes sobre as fontes de 
dados. 


E a generalização das conclusões sobre as fontes de dados. 


É a obtenção dos dados, seja por meio de simples observação ou 


mediante a utilização de alguma ferramenta. 


4. Agora, assinale a assertiva que define a estatística indutiva. 


a) 


b) 


c) 


d) 


e) 


É o cálculo de medidas que permite descrever, com detalhes, o 


fenômeno que está sendo analisado. 
É a parte da estatística referente à coleta e à tabulação dos dados. 


É a parte da estatística referente às conclusões sobre as fontes de 
dados. 


E a generalização das conclusões sobre as fontes de dados. 


É a obtenção dos dados, seja por meio de simples observação ou 


mediante a utilização de alguma ferramenta. 
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5. Assinale com (F) se for falsa e com (V) se for verdadeira a afirmação. 


Sào duas fases do método estatístico: 
( T Criar um problema e coletar os dados. 
( T Criar um problema e analisar os dados. 
( )Planejar um problema e coletar os dados. 
( ) Coletar os dados e analisar os dados. 


( )Apurar os dados e analisar um problema. 
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Apresentação dos dados 


Conteúdos do capítulo 
e Tabulação e seus procedimentos 
e A distribuição de frequências na apresentação de resultados 
e  Arepresentacaáo gráfica na apresentação de dados 
Após o estudo deste capítulo, vocé será capaz de: 
1. construir e identificar uma tabela estatística; 


2. desenhar um gráfico e interpretá-lo; 
3. dominar noções preliminares sobre distribuição de frequências e séries. 


Tabulação 


Dados brutos, rol e frequência 
Dados brutos? Rol? Frequência? O que é isso? 
É algo extremamente simples. 
Imaginemos que um teste foi aplicado a uma turma de 50 alunos. 
Lembre-se, esses 50 alunos constituem a população a ser pesquisada. 


Imaginemos também que, à medida que faz a correção dos testes, o pro- 
fessor anote as notas obtidas pelos alunos. A transcrição desses resultados 
constitui o que denominamos, na estatística, de dados brutos. 


Logo dados brutos são a relação dos resultados obtidos em uma pesquisa 


e que foram transcritos aleatoriamente, ou seja, fora de qualquer ordem. 


Os dados brutos são os dados originais, coletados em uma pesquisa, e que 
ainda não se encontram prontos para análise por não estarem numerica- 


mente organizados.! 


Vamos supor que as notas do teste, a que nos referimos, tenham sido as 
seguintes: 


7-6-8-9-6-5-7-4-6-8-9-8-7-6-10-8-4-5-6-10-5-8-4-3 
-6-7-9-6-10-7-7-7-9-5-4-5-9-10-8-8-6-7-5-10-8-6-7-7 
- 10- 6. 
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Em uma simples olhada para esses números, pouca ou nenhuma infor- 
mação nos é transmitida. E preciso, então, primeiramente colocá-los em 


ordem, ou seja, transformá-los em um “rol”. 


Rol, portanto, é a relação dos resultados obtidos em uma pesquisa e que 


foram colocados em ordem numérica, crescente ou decrescente. 


Coloquemos em ordem crescente os dados brutos anteriormente relacio- 


nados. 


3-4-4-4-4-5-5-5-5-5-5-6-6-6-6-6-6-6-6-6-7-7-7-7-7 
-7-7-7-7-7-8-8-8-8-8-8-8-8-8-9-9-9-9-9-10-10-10- 10 
- 10 - 10. 


Melhorou! No entanto, ainda está confuso para tirarmos alguma conclusão. 


O que devemos fazer então? 


Precisamos, agora, agrupar os valores que são iguais, para que possamos 
deduzir alguma coisa a respeito dos resultados obtidos nesse teste aplicado 


à turma de 50 alunos. 


O primeiro passo consiste em verificarmos se temos notas que se repetem, 
isto é, se existem dois ou mais alunos com a mesma nota. Ao número de 


vezes que um mesmo valor se repete, denominamos de frequência. 


Frequência ou frequência absoluta é o número de vezes que um mesmo 


resultado acontece durante uma pesquisa. Nós a denominaremos de f. 


No exemplo que estamos analisando, temos os resultados que estão na 
Tabela 1. 


Tabela 1 - Notas obtidas pelos alunos 


Notas | Frequência 

3 1 

4 4 

5 6 

6 9 

7 10 

8 9 

9 
10 
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Agora ficou mais fácil interpretar os resultados obtidos pela turma. Veri- 
ficamos que a menor nota foi 3 e a maior foi 10. Verificamos ainda que a 
nota que ocorreu com a maior frequéncia (ou seja, que ocorreu o maior 


nümero de vezes) foi 7. 


Frequéncia absoluta acumulada ou frequéncia acumulada (fa) 


Frequéncia acumulada é o somatório das frequéncias dos valores inferio- 
res ou iguais ao valor dado. Nós a designaremos por fa. Vejamos, como 
exemplo, a Tabela 2. 


Tabela 2 — Frequência acumulada da idade dos alunos 


Idade Frequência (f) Frequência acumulada (fa) 
4 4 [DS 4 
+ 
5 5 tels 9 
+ 
6 7 E. m 16 
+ 
7 4 la Lo. 20 
Tabelas 


Uma vez concluída a coleta e, também, a ordenação dos dados de uma 
pesquisa, devemos apresentá-los de tal forma que o leitor consiga identifi- 
car, rapidamente, uma série de informações. Para tal, a estatística costuma 


utilizar-se de duas ferramentas: tabelas e gráficos. 
Vamos começar pelo estudo de tabelas. 


A estrutura de uma tabela é constituída de três partes: cabeçalho, corpo e 
rodapé. 


O cABEÇALHO é a parte da tabela que contém o suficiente para esclarecer o 
leitor quanto ao que ela sintetiza. Por exemplo, NOTAS DA TURMA À EM Esrarís- 


TICA — 1º BIMESTRE/2006. 


O corro da tabela é constituído por linhas e colunas, nas quais são distri- 
buídos os dados apurados na pesquisa. 
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O RODAPÉ é o espaço no qual são colocadas as informações que permitem 
esclarecer a interpretação da tabela. Por exemplo, no rodapé colocamos a 
legenda e a fonte dos dados. 


fL. 1 Exercício Resolvido 


Vamos, então, representar em uma tabela os resultados do teste que foi 
aplicado à turma de 50 alunos, cujos resultados já foram ordenados ante- 


riormente? 


Tabela 3 — Notas da turma A em Estatística — 1º bimestre/2010 


| cabecalho 
Notas Frequência 

3 1 

4 4 

5 6 corpo 

6 9 

7 10 

8 9 

9 

10 6 


Fonte: Dados fictícios elaborados pelo autor. 4— — — — — —— rodapé 


Distribuição de frequências 


Quando estuda uma variável, o maior interesse do pesquisador é conhecer 
o comportamento dessa variável, analisando a ocorrência de suas possíveis 
realizações. Uma distribuição de frequências é a apresentação dos resulta- 
dos de uma pesquisa por meio de uma tabela que mostra a frequência (o 


número de vezes) de ocorrência de cada resultado. 


Assim, a Tabela 3, mostrada anteriormente, é uma distribuição de frequên- 
cias. 
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TU. "Exercícios Resolvidos 


Vamos praticar para que você tire suas dúvidas. 


Vamos supor que desejamos conhecer a altura dos 50 alunos que realizaram 
o teste, anteriormente mencionado. Imaginemos que os resultados obtidos 


nas medições, em centímetros (dados brutos), foram: 


160 - 168 - 174 - 169 - 180 - 165 - 173 - 174 - 170 - 168 - 172 - 164 - 164 - 170 
- 167 - 178 - 175 - 165 - 176 - 165 - 161 - 170 - 172 - 179 - 160 - 177 - 174 - 167 
- 162 - 171 - 177 - 167 - 163 - 177 - 165 - 178 - 170 - 170 - 174 - 165 - 166 - 170 - 
170 - 168 - 178 - 166 - 175 - 176 - 168 - 167. 


Agora, vamos transformar esses dados brutos em um ROL: 


160 - 160 - 161 - 162 - 163 - 164 - 164 - 165 - 165 - 165 - 165 - 165 - 166 - 166 
- 167 - 167 - 167 - 167 - 168 - 168 - 168 - 168 - 169 - 170 - 170 - 170 - 170 - 170 
- 170 - 170 - 171 - 172 - 172 - 173 - 174 - 174 - 174 - 174 - 175 - 175 - 176 - 176 - 

177 - 177 - 177 - 178 - 178 - 178 - 179 - 180. 


Façamos agora uma tabela com a distribuição de frequências dessa pes- 


quisa. 


rais é crime estabelecido na Lei nº 9.610/1998 e punido pelo art. 184 do Código Penal. 
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Tabela 4 — Alturas dos alunos da turma A - 1? bimestre/2010 


Alturas (cm) Frequéncia (f) 
160 
161 
162 
163 
164 
165 
166 
167 
168 
169 
170 
171 
172 
173 
174 
175 
176 
177 
178 
179 
180 


N 


AoA AVANT RA A NANE Hon 


Fonte: Dados fictícios elaborados pelo autor. 


Anote e guarde bem as definições de dados brutos, rol, frequência, 
frequência acumulada e de distribuição de frequências. 


Classes ou intervalos 


Quando o número de resultados obtidos em uma pesquisa é demasiada- 
mente grande, é comum agruparmos esses resultados em faixas de valo- 
res, denominadas de classes ou intervalos. Por exemplo, se um pesquisador 
deseja saber a idade das pessoas pesquisadas, ele as distribui em faixas 
etárias. 


No entanto, ao resumirmos os valores individuais em intervalos ou classes, 


estamos conscientes de que algum erro pode estar sendo inserido. 
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Lembram-se dos 50 alunos que fizeram o teste, cujos resultados tabulamos an- 


teriormente? Suponhamos que estejamos interessados em saber a faixa etária 


em que se encontram esses alunos, conforme representado na tabela 5. 


Tabela 5 - Faixa etária dos alunos 


Faixa etária 


Alunos (f) 


0a5anos 


6a 10 anos 


11 a 15 anos 


16 a 20 anos 


21 a 25 anos 


26 a 30 anos 


Aos valores à esquerda de cada faixa etária, damos o nome de limites infe- 


riores (Li), e aos valores à direita, damos o nome de limites superiores (Ls) 


das classes ou intervalos. A representação acima é utilizada pelos órgãos 


governamentais; contudo, em trabalhos acadêmicos, a forma de represen- 


tar uma classe ou intervalo é a que mostramos na tabela 6. 


Tabela 6 — Faixa etária dos alunos 


Faixa etária Alunos (f) 
01— — 5 anos 
5 — 10 anos 
10 — — 15 anos 
15 — — 20 anos 
20 1— — 25 anos 
25 | — 30 anos 


O símbolo — — representa que a classe ou intervalo é fechado à esquerda, 


ou seja, o valor escrito à esquerda (limite inferior) pertence ao intervalo e, 


como a classe ou intervalo é aberto à direita, o valor escrito à direita (limite 


superior) nào pertence ao mesmo. 


Observe que, qualquer que seja a idade da pessoa pesquisada, ela se 


encaixa em apenas um dos intervalos. 


È 
8 
8 
8 
8 
8 
E 
E 
E 
$ 
i 
à 
E 
ê 
g 
E 
i 
E] 
E 
& 
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Se subtrairmos o limite inferior do limite superior de determinada classe 
ou intervalo, temos o que se denomina de AMPLITUDE DO INTERVALO. Por 
exemplo, na tabela anterior, 25 menos 20 é igual a 5. Essa é a amplitude 
dos intervalos: 5. 


Suponhamos que obtivemos o resultado abaixo, na pesquisa realizada. 


Tabela 7 — Faixa etária dos alunos da turma A - 1? bimestre/2010 


Faixa etária Alunos (f) 
0 1— — 5 anos 0 
5 1— 10 anos 6 
10 |———- 15 anos 14 
15 1— —- 20 anos 20 
20 1 — 25 anos 8 
25 — 30 anos 2 


A distribuição dos dados em classes ou intervalos é comumente utilizada 
quando temos uma população muito grande para representar. Por exem- 
plo, desejamos fazer uma tabela com os resultados dos 50.000 candidatos 
ao vestibular de determinada universidade federal; como as notas assu- 
mem, nesse caso, uma infinidade de valores, é conveniente agrupá-las em 
classes. A amplitude da classe quem define é o responsável pela tabela, 
entretanto, é oportuno observar que todas as classes devem ter a mesma 
amplitude, para facilitar os cálculos que iremos aprender adiante. 


E QUANTAS CLASSES DEVE TER A TABELA? 


Para que tenhamos confiabilidade nas informações, é apropriado que o 
número mínimo de classes ou intervalos seja igual a 5. Para que o visual 
da tabela não seja poluído, principalmente ao transformarmos a tabela em 
um gráfico, o número máximo de classes ou intervalos deve ser igual a 20. 


Lembre-se, esses números são apenas uma recomendação. 


Outras grandezas são comumente agrupadas em classes ou intervalos, sendo 
que se destacam, entre elas, salários, pesos e alturas (entre outras). 
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Limites dos intervalos, ou classes 
Esse assunto também já é de seu conhecimento. Mas vamos recordá-lo. 


Os limites de um intervalo ou classe são os números extremos de cada 
intervalo ou classe. Por exemplo, na classe 20--— 25, da tabela 7, o limite 
à esquerda (20) é denominado de limite inferior (Li) e o limite à direita (25) 


é denominado de limite superior (Ls). 


No caso, o valor 20 pertence ao intervalo, ou classe, e o valor 25 nào pertence. 


Lembre-se: um determinado valor só pode pertencer a um ünico inter- 


valo (ou classe). No caso, o 25 pertence ao intervalo que vai de 25 a 30. 


rt. 184 do Código Penal. 


Amplitude dos intervalos, ou classes (A) 


A amplitude do intervalo (ou classe) é obtida subtraindo-se o limite supe- 
rior do limite inferior de qualquer classe da série (A = Ls — Li). Por exemplo, 
A — 25 - 20 7 5, então, na distribuição de frequências anterior, os intervalos 


(ou classes) tém amplitude A - 5. 


Ponto médio do intervalo, ou classe (Pm) 


E 
É 


A partir do momento que resolvemos agrupar os resultados obtidos numa 
pesquisa em intervalos (ou classes), assumimos que para todo intervalo o 
resultado é um valor único e igual ao ponto médio do respectivo intervalo. 
Por isso, afirmamos, anteriormente, que estamos conscientes de que um erro 
pode estar sendo inserido. Por exemplo, para o intervalo cujo limite inferior 
é 20 e cujo limite superior é 25, o ponto médio do intervalo é: 


20425 


Pm -22,5 


Assumimos, desse modo, que as oito pessoas que estão nesse intervalo têm 


22 anos e meio. 


Agora, vamos agrupar em classes as alturas dos 50 alunos dos nossos pro- 
blemas anteriores (ver Tabela 4); para isso faremos intervalos com ampli- 
tude igual a 3 centímetros (ver Tabela 8). 


No capítulo 3, estudaremos, em detalhes, como determinar esse número 


de classes ou intervalos. 


Tabela 8 — Alturas dos alunos da turma A - 1? bimestre/2006 


Alturas Alunos (f) 
160 -— 163 4 
163 | .—— 166 8 
166 1— — 169 10 
169 | —— 172 9 
172 I— — 175 7 
175 | — 178 7 
178 —— 181 5 


Frequéncia relativa (fr) 


A frequéncia relativa de um valor é dada pela fórmula: 


& -i, em quen - xf 
n 


Para exemplificar, vamos analisar a distribuicào de frequéncias da tabela 9. 


Tabela 9 — Frequência relativa das idades dos alunos 


Idades Frequência(f) | Frequência relativa (fr) 
18 —— 21 9 9/100 
21 j| —— 24 12 12/100 
24 — 27 12 12/100 
27 —— 30 17 17/100 
30 ———— 33 16 16/100 
33 c 36 14 14/100 
36 —— 39 11 11/100 
39 —— 42 9 9/100 
z 100 100/100 = 1 


* O símbolo Z é a letra grega maiúscula sigma, correspondente ao S do nosso alfabeto. Aqui, X 


significa somatório e Xf significa o somatório de f, isto é, f, + E L f. 
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Séries estatísticas 


SÉRIE ESTATÍSTICA é a denominação que se dá a uma tabela na qual há um 


critério distinto que a especifica e a diferencia. Assim, podemos classificar 


as séries estatísticas em: 


a) temporais (ou cronológicas, ou evolutivas, ou históricas); 


b) geográficas (ou de localização, ou territorial, ou espacial); 


c) específicas (ou categóricas, ou de qualidade); 


d) conjugadas (ou mistas); 


e) de distribuição de frequências. 


As séries estatísticas diferenciam-se de acordo com a variação de um dos se- 


guintes elementos: tempo (época), local (fator geográfico) e fato (fenômeno). 


Séries estatísticas temporais 


A SÉRIE TEMPORAL tem como característica a variação do tempo (época), en- 


quanto o local (fator geográfico) e o fato (fenômeno) permanecem fixos. 


São, portanto, séries em que os dados são produzidos (observados) ao longo 
do tempo. Ver Tabela 10. 


Tabela 10 - Número de veículos exportados no més de janeiro, pelo Brasil, 


nos últimos cinco anos, da marca X 


Ano Automóveis exportados 
2006 998 

2007 1.234 

2008 1.405 

2009 890 

2010 1.665 


Séries estatísticas geográficas 


A SÉRIE GEOGRÁFICA tem como característica a variação do local de ocorrência 


(fator geográfico), enquanto o tempo (a época) e o fato (o fenômeno) per- 


manecem fixos. Ver Tabela 11. 
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Tabela 11 — Estimativas populacionais do Brasil — grandes regiões 


Região População 
Norte 12.900.704 
Nordeste 47.741.711 
Sudeste 72.412.411 
Sul 25.107.616 
Centro-Oeste 11.636.728 


Fonte: IBGE, Censo Demográfico 2000. 


Séries estatísticas específicas 


A SÉRIE ESPECÍFICA tem como característica a variação do fato (variação do 


fenómeno), enquanto que o local (fator geográfico) e o tempo (a época) sáo 


constantes. Isso significa que os dados sáo agrupados segundo a modali- 


dade de ocorréncia. Ver Tabela 12. 


Tabela 12 - Nümero de candidatos para o vestibular em uma determinada 


universidade - 2010 (terceiro grau) 


Áreas ofertadas 


Número de candidatos 


Ciências Sociais Aplicadas 5.404 
Ciências Exatas 3.221 
Ciências Humanas 6.558 
Ciências Biológicas 2.489 
Ciências Tecnológicas 1.559 


Observe que, nesse caso, o fato se apresenta como um todo. Caso o fato se 


apresente disposto em classes, ou intervalos (dados agrupados), dá origem 


à chamada distribuição de frequências, já estudada por nós. 


Séries estatísticas conjugadas 


Uma SÉRIE é CONJUGADA, ou mista, quando existe a combinação entre as séries 


temporais, geográficas e específicas. Podem, portanto, variar o tempo (a época), 


o local (fator geográfico) e o fato (o fenômeno) simultaneamente. Ver tabela 13. 
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Tabela 13 - Número de veículos zero km da marca X vendidos no Brasil, 


nos últimos cinco anos, por região 


Veículos vendidos 


Ano Norte | Nordeste | Sudeste Sul Centro-Oeste 
2006 1.845 4.111 1.3802 8.901 3.470 
2007 1.903 4.100 1.3944 9.380 3.401 
2008 1.899 4.189 1.3784 9.182 3.532 
2009 1.847 4.333 1.4053 9.044 3.744 
2010 2.005 4.704 1.4188 10.085 3.987 


A distribuição de frequências, tal como a estudamos, é considerada uma 
quinta modalidade de série estatística. Trata-se de uma série estatística 
específica, em que os dados estão dispostos em classes, com suas respecti- 
vas frequências absolutas. Ver Tabela 14. 


Tabela 14 - Quantidade de pessoas, por faixa etária, que têm plano de saúde 
em determinada localidade 


Idade Nº de pessoas 
0-—— 10 208 
10 — 20 431 
20 | —— 30 644 
30 .— — 40 955 
40 | L——— 50 938 
50 — 60 745 
60 —— 70 730 
70 — 80 433 
Gráficos 


A representação gráfica é um complemento da apresentação dos dados em 
forma de tabelas, uma vez que permite uma rápida visualização do fato es- 
tudado. Todo gráfico, assim como as tabelas, tem na sua parte superior um 
título, e na parte inferior é dada a fonte que forneceu o gráfico ou os dados 


que permitiram a sua construção. 
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Há uma infinidade de gráficos. Vamos verificar os principais tipos a serem 
utilizados na estatística, ou seja, gráfico de colunas, de barras, de setores, 
bem como histograma e polígono de frequéncias. 


Gráfico de colunas 


O gráfico de colunas é utilizado para as séries temporais, geográficas e espe- 
cíficas. COMO CONSTRUÍ-LO? 


Primeiro, trace um par de eixos ortogonais (sistema de eixos cartesianos): 


a) o eixo horizontal (eixo x) chama-se eixo das abscissas e a sua escala 
cresce da esquerda para a direita, a partir da origem (interseção dos 
eixos horizontal e vertical); 


b) o eixo vertical (eixo y) chama-se eixo das ordenadas e a sua escala 
cresce de baixo para cima, a partir da origem. 


Na sequência, apresente a variável que está sendo estudada no eixo das 
abscissas e a frequência no eixo das ordenadas; após o que, dê um título 
ao gráfico. 


fL. 7 Exercício Resolvido 


Vamos transformar a tabela 10, apresentada nas séries estatísticas temporais, 
no gráfico 1? 


Gráfico 1 - Número de veículos exportados no mês de janeiro, pelo Brasil, 


nos últimos cinco anos, da marca X 


Veículos exportados 


1.200 
900 
600 í li 
300 
» ano 


0 2006 2007 2008 2009 2010 
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Gráfico de barras 


E semelhante ao anterior, porém os retângulos são dispostos na horizontal. 


E também utilizado para as séries temporais, geográficas e específicas. 


fL. 1 Exercício Resolvido 


Agora, vamos transformar a Tabela 11, apresentada nas séries estatísticas 
geográficas, no Gráfico 2? 


Gráfico 2 — Estimativas populacionais do Brasil - grandes regiões 


Regiões 
A 


Região Norte E] 
Região Nordeste ESEC 
Região Sul qmd 
AT 
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» 
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População (. 1.000.000) 


Gráfico de setores 


O gráfico de setores é popularmente conhecido como gráfico em forma de 
pizza. Trata-se de uma representação em um círculo dividido em setores. É 
muito útil quando desejamos comparar cada valor da série estatística com 
o total. 


Como CONSTRUÍ-LO? 


E só seguir os passos que detalharemos na sequência: 
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a) trace uma circunferéncia (lembre-se que a área do círculo corres- 
ponde ao todo, ou seja, 100%); 


b) divida o círculo em setores, cujas áreas sào proporcionais aos valo- 
res da série estatística (essa divisão pode ser obtida pela solução de 
uma regra de trés simples), ou seja: 


total ———— — —» 360? 

parte —— — ——» x? 
c) preencha cada setor de modo diferente ou com cores diferentes; 
d) dê um título ao gráfico; 


e) faça uma legenda para explicar os preenchimentos ou as cores utili- 
zadas. 


Observe um gráfico de setores no Gráfico 3. 


Gráfico 3 — Exportações dos produtos A, B, C no més de setembro de 2006 


120º 
105º 
produto A 
L | produto B 
135° produto C 
Histograma 


O histograma é um gráfico formado por um conjunto de retângulos justapos- 
tos e é muito utilizado para representar a distribuição de frequências cujos 
dados foram agrupados em classes ou intervalos de mesma amplitude. 


39 


Nenhuma parte desta publicação poderá ser reproduzida por qualquer meio ou forma sem a prévia autorização da Editora Ibpex. A violação dos direltos autorais é crime estabelecido na Lei nº 9.610/1998 e punido pelo art. 184 do Código Penal. 


40 


Como coNsTRUÍ-LO? 
E só observar as seguintes etapas: 
a) trace um par de eixos ortogonais (sistema de eixos cartesianos); 


b) no eixo horizontal (eixo x), anote os valores individuais da variável 


em estudo, ou seja, os valores dos intervalos das classes; 


c) no eixo vertical (eixo y), anote os valores dos números de observa- 


ções, ou seja, as frequências das classes; 


d) dê um título ao gráfico. 


TU + Exercício Resolvido 


E como transformarmos uma tabela em um histograma? Vamos, então, 
transformar a Tabela 8, apresentada nas séries estatísticas de distribuição 
de frequências no Gráfico 4, ou seja, em um histograma? 


Gráfico 4 — Alturas dos alunos da turma A - 1? bimestre/2010 
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Polígono de frequéncias 


O polígono de frequéncias é obtido unindo-se por segmentos de reta os 
pontos médios das bases superiores dos retângulos de um histograma. 
Como exemplo, vamos transformar o gráfico anterior (Gráfico 4) em um 


polígono de frequéncias (Gráfico 5). 
Gráfico 5 - Alturas dos alunos da turma A - 1? bimestre/2010 
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At Sintese 


Se pretendermos ser capazes de construir e identificar uma tabela estatísti- 


ca, precisamos construir antes algumas concepções por meio do desenvol- 


vimento de determinadas habilidades. No caso, precisamos conhecer fa- 


tores como dados brutos, rol e frequência para sermos capazes de realizar 


uma tabulação. No entanto, a realização de uma tabulação também requer 


conhecimentos de frequência acumulada (fa), habilidade na estruturação 


de tabelas, bem como na distribuição de frequências. Mas, para desenhar 


um gráfico e interpretá-lo, outras habilidades devem ser somadas àquelas, 


como identificar as séries estatísticas. Esse foi o processo que procuramos 


desenvolver neste capítulo. 


71 Questoes para revisao 


1. Aorealizarmos um teste de Estatística em uma turma constituída por 


40 alunos, obtivemos os seguintes resultados (dados brutos): 


7-6-8-7-6-4-5-7-7-8-5- 10-6-7-8-5-10-4-6-7-7-9-5 
-6-8-6-7-10-4-6-9-5-8-9-10-7-7-5-9- 10. 


Qual o resultado que aconteceu com a maior frequéncia? 


( )10 
()9 
(08 


()6 L oí 
()5 
()4 


2. Observe a tabela a seguir, e depois marque a alternativa correta na 


relação apresentada no começo da próxima página. 


Ano Exportações (em US$ 1.000.000,00) 
2006 204 

2007 234 

2008 652 

2009 888 

2010 1.205 


Fonte: Dados fictícios elaborados pelo autor. 


Nenhuma parte desta publicação poderá ser reproduzida por qualquer meio ou forma sem a prévia autorização da Editora Ibpex. A violação dos direltos autorais é crime estabelecido na Lei nº 9610/1998 e punido pelo art. 184 do Código Penal. 


A série estatística representada é: 
( ) Cronológica. 

( ) Geográfica. 

( ) Conjugada. 

( ) Específica. 

( ) Espacial. 


3. Assinale a resposta correta. Na distribuição de frequências a seguir, 
qual a amplitude das classes ou intervalos? 


Ano Alunos (f) 
20 L 25 8 
25 —— 30 8 
30 ———— 35 8 
35 — 40 8 
40 —— 45 8 
45 | ——— 50 8 


Fonte: Dados fictícios elaborados pelo autor. 
()30 ()8 ()50 ()5 ()6 
4. Observe o gráfico representado a seguir. 


Apartamentos vendidos 
A 
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Nós vimos que os gráficos podem ser de setores, de barras, de colunas, 
em forma de histograma ou de polígono. Como você classifica este 
que foi aqui representado? 


Descreva quais são as partes que constituem uma tabela. 


E 
Š 
8 
8 
8 
$ 
i 
E 
E 
$ 
H 
à 
8 
$ 
E 
E] 
E 
B 
E 
8 
$ 
E] 
E 
$ 
E 
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Distribuição de frequências 


Conteúdos do capítulo 


e A finalidade e operacionalidade da distribuição de frequências. 

e Classificação e contextualização das variáveis qualitativas e quantita- 
tivas. 

e Determinação do número de classes ou intervalos. 


Após o estudo deste capítulo, você será capaz de: 


1. identificar todas as partes constituintes de uma tabela representativa de 
uma distribuição de frequências; 

2. interpretar os dados de uma tabela representativa de uma distribuição 
de frequências. 


A distribuição de frequências 


No capítulo anterior estudamos séries estatísticas. Dos tipos estudados, a 
mais importante na estatística descritiva é a distribuição de frequências. 


Havíamos definido que: 


SÉRIE ESTATÍSTICA é a denominação que se dá a uma tabela na qual há um 
critério distinto que a especifica e a diferencia; 

À DISTRIBUIÇÃO DE FREQUÊNCIAS é uma série estatística específica, em que 
os dados estão dispostos em classes, com suas respectivas frequências 
absolutas. 


Vamos rever alguns conceitos e aprender outros. 


População 


População é o conjunto de elementos que desejamos observar para obter 


È 
8 
8 
8 
8 
8 
E 
E 
E 
$ 
i 
H 
8 
$ 
E 
2 
E 
ê 
E 
E 
i 
E] 
E 
& 
E 


determinados dados. 


A população pode conter um número conhecido de elementos e, nesse 
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caso, a denominamos de população finita. Por exemplo, podemos estar in- 
teressados em estudar o consumo individual de água em 40 residências 
de um condomínio fechado, portanto sabemos exatamente quantas são as 
residências a analisar, ou seja, 40. 


No entanto, nem sempre é assim, a população pode conter um número des- 
conhecido ou um número muito grande de elementos, caso este em que de- 


nominamos de infinita; podemos, por exemplo, estar interessados em saber 


a intencáo de voto em determinado candidato à presidéncia da repüblica 


— uma população infinita. 


Amostra 


Amostra é o subconjunto de elementos retirados da população que esta- 
mos observando para obter determinados dados. 


Variáveis 


Podemos definir a variável como uma característica que observamos numa 


pesquisa e que pode assumir diferentes valores. 


Por exemplo, se numa pesquisa estivermos interessados em anotar o sexo 
das pessoas que dela participam, podemos associar os valores masculino 


ou feminino à variável sexo. 


Observamos que algumas variáveis descrevem qualidades (ou categorias, 
ou atributos) tais como sexo, escolaridade, status social, estado civil e tipo 
sanguíneo, entre outros. Tais variáveis são denominadas qualitativas e, nor- 


malmente, não podem ser expressas em valores numéricos. 


As variáveis qualitativas podem ainda ser classificadas em dois diferen- 


tes grupos: nominais e ordinais. 


A VARIÁVEL QUALITATIVA NOMINAL permite somente a classificação dos dados, 
como é o caso da variável sexo e do ramo de atividade de uma empresa, entre 


outras. 


A VARIÁVEL QUALITATIVA ORDINAL permite que se estabeleça uma ordem nos 
seus resultados como, por exemplo, o grau de instrução ou o status (classe) 
social de um grupo de pessoas. 


Observamos, entretanto, que algumas variáveis podem ser expressas por 


Z 
8 
8 
8 
8 
8 
i 
E 
E 
$ 
i 
à 
E 
ê 
g 
E 
E 
E] 
E 
& 


meio de valores numéricos, como nümero de filhos ou de dependentes, ida- 


de, peso (massa), altura, quantidade de sacas de milho colhidas por hectare, 
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entre outros. Essas variáveis são denominadas de quantitativas. 


As variáveis quantitativas também podem ser classificadas em dois 


diferentes grupos: discretas e contínuas. 


A VARIÁVEL QUANTITATIVA DISCRETA permite relacionar todos os possíveis 
valores que ela pode assumir. Além disso, apresenta lacunas entre os va- 
lores que pode tomar para si, tais como número de peças defeituosas pro- 
duzidas por determinada máquina ou o número de filhos dos empregados 


de determinada empresa. 
47 
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A VARIÁVEL QUANTITATIVA CONTÍNUA, por sua vez, pode assumir infinitos 
valores dentro de um intervalo de nümeros reais, de tal forma que nào 
podemos previamente relacionar todos os possíveis resultados a encontrar 
na pesquisa. Como exemplo, podemos citar a altura (estatura) dos empre- 
gados de uma fábrica ou as diferentes temperaturas registradas ao longo 
de certo tempo em uma localidade. 


Às vezes, podemos atribuir valores numéricos a determinada variável quali- 
tativa e tratá-la como se fosse quantitativa. Quando isso é possível? Quando, 
a essa variável qualitativa, atribuirmos somente dois possíveis valores. Vocé 
verá, no capítulo 8, que esses dois valores seráo denominados de sucesso e 


insucesso (ou fracasso). 


Resumidamente, VARIÁVEIS QUANTITATIVAS são medições e contagens. VA- 
RIÁVEIS QUALITATIVAS descrevem pertinência ao grupo. 
Variáveis com poucos valores repetidos são consideradas contínuas. 


Variáveis com muitos valores repetidos são consideradas discretas.! 


Convém ressaltar que, caso a variável em estudo seja contínua, é conve- 


niente agrupar os valores obtidos em classes ou intervalos. 


Número de classes ou intervalos 


Como DETERMINAR A QUANTIDADE DE INTERVALOS EM UMA DISTRIBUIÇÃO DE 


FREQUÊNCIAS? 


Para tal, não há fórmula exata. Entretanto, recomenda-se que o número 
mínimo de intervalos seja igual a 5 e o número máximo igual a 20, o que 
facilita a construção da tabela e do respectivo gráfico, com um mínimo de 


precisão e de informação. 


Como exemplo, suponhamos que perguntamos a idade a um grupo de 100 
pessoas e, ainda, que desejamos representar os resultados obtidos distribuí- 


dos em intervalos (ou classes). Vamos presumir os seguintes resultados, já 
dispostos em forma de rol: 


18-18-18-19-19-19-19-20-20-21-21-21-21-22-22-22-23-23 

- 23 - 23 - 23 - 24 - 24 - 24 - 24 - 25 - 25 - 25 - 26 - 26 - 26 - 26 - 26 - 27 - 27 - 27 
- 28 - 28 - 28 - 28 - 28 - 29 - 29 - 29 - 29 - 29 - 29 - 29 - 29 - 29 - 30 - 30 - 30 - 30 
- 31 - 31 - 31 - 31 - 31 - 31 - 32 - 32 - 32 - 32 - 32 - 32 - 33 - 33 - 33 - 33 - 33 - 33 
- 34 - 34 - 34 - 34 - 35 - 35 - 35 - 35 - 36 - 36 - 36 - 37 - 37 - 37 - 37 - 38 - 38 - 38 
- 38 - 39 - 39 - 40 - 40 - 40 - 41 - 41 - 42 - 42. 
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Nesse caso, inicialmente elaboramos uma tabela de distribuição de frequén- 


cias, considerando-se os valores individuais. 


Tabela 15 - Distribuição das idades de 100 pessoas 


Idade Frequência (f) 


18 
19 
20 
21 
22 
23 
24 
25 
26 
27 
28 
29 
30 
31 
32 
33 
34 
35 
36 
37 
38 
39 
40 
41 
42 


[e] 


N N CQ) P2 A AÀA OE 4 OQ ON GO dH iO 0 Ui CQ ROO 4A NR 


Na sequéncia, agrupamos esses resultados em intervalos (ou classes); para 
tal devemos definir quantos intervalos queremos fazer, tomando o cuidado 
para que todos tenham o mesmo tamanho (ou amplitude). Podemos, por 
exemplo, optar por oito intervalos de amplitude igual a 3. 


MAs, COMO OBTIVEMOS ESSES VALORES? Observe que a idade maior é 42 anos 


e a menor é 18 anos. Logo, temos o intervalo de: 
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42-18-24 (essa é amplitude total, também denominada de range) 
24:8=3 
Teremos, então, a tabela 16. 


Tabela 16 — Distribuição das idades em intervalos 


Ano Alunos (f) 
18 1— — 21 9 
21 — — 24 12 
24 —— 27 12 
27 = 30 17 
30 1— — 33 16 
33 1— — 36 14 
36 |— — 39 11 
39 1— —3142 9 


A representação — indica que tanto o 39 quanto o 42 pertencem a essa 


classe ou intervalo. 


Para a utilizacáo de uma fórmula que nos permita determinar a quantidade 
de intervalos, devemos tomar o cuidado para que todos tenham a mesma 
amplitude (A). Vocé lembra que recomendamos que esse nümero esteja 
entre os valores 5 e 20. Já vimos, também, que A = Ls - Li. 


CHAMAMOS DE i O NÚMERO DE CLASSES OU INTERVALOS. Então, a amplitude de 


cada classe será igual a: 


Caso essa divisão resulte em um valor não inteiro, convém fazer um arre- 
dondamento para o nümero inteiro mais próximo, sempre para um nüme- 


ro maior que o resultado encontrado na divisão. 


Como sabemos, com o nümero de classes (i) e a amplitude de cada classe 
(A) podemos construir a tabela de distribuição de frequências. 
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Salientamos o fato de que o nümero de classes ou intervalos pode ser deter- 
minado por diversos métodos, entre os quais se destaca o método de Sturges, 


em que: 
i-1-33-logn 


Sendo n o número total de observações, ou seja, a quantidade de dados 


que temos no rol. 


fL. Exercícios Resolvidos 


1. Suponhamos que uma pesquisa resultou em 800 observações. NEssE 


CASO, QUANTAS CLASSES OU INTERVALOS TEMOS? 
Aplicando a fórmula do método de Sturges, temos que: 
i=1+3,3- log 800 

i=1+3,3.2,9031 

i=10,58023 


Concluímos, portanto, que para 800 observações devemos ter 11 classes ou 


intervalos de valores. 


Suponhamos, agora, uma pesquisa em que temos somente 40 observações: 


quantas são as classes (ou intervalos)? 
i=1+3,3-log 40 

i=1 +3,3 -1,60206 

i = 6,2868 

Resposta: No caso, temos sete classes (ou intervalos). 


Entretanto, na prática, costumamos usar o bom senso na hora de deter- 
minar essa quantidade e nào utilizamos qualquer método ou regra que 


aplique uma fórmula. 
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2. Asnotas obtidas pelos alunos de uma classe, em um teste de Estatística, 
estão descritas a seguir em uma tabela de distribuição de frequências. 


Tabela 17 — Notas obtidas em um teste de Estatística distribuídas em intervalos 


Notas Frequência (f) 

0 1———1 4 
HH 2 5 
2.1— — 9 7 
3m4 8 
4 1——5 9 
51—— 6 14 
6. L——— 7 8 
7 — 8 
8—9 
9 —10 

X 70 


Em RELAÇÃO A ESSA TABELA, PEDIMOS PARA DETERMINAR: 
a) A AMPLITUDE TOTAL; 


Para o cálculo da amplitude total, subtraimos o maior valor do menor dos 
resultados obtidos. 


No caso: 10 - 0 = 10. 

b) A QUANTIDADE DE CLASSES OU INTERVALOS; 

Basta contar quantos são os intervalos; no caso, 10. 
C) A AMPLITUDE DAS CLASSES OU INTERVALOS; 


Subtraimos o limite superior de uma classe qualquer do seu limite inferior. 
Por exemplo, na quinta classe, 5 — 4 - 1; então, as classes têm amplitude 
igual a 1. 


d) O LIMITE SUPERIOR DA TERCEIRA CLASSE; 


As classes sào contadas de cima para baixo; logo, a terceira classe compreende 
as notas de 2 até 3; sendo que o limite superior dessa classe é o 3. 


e) O LIMITE INFERIOR DA QUINTA CLASSE; 


O limite inferior é o 4, pois a quinta classe compreende as notas de 4 até 5. 


E 
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f) O PONTO MÉDIO DA DÉCIMA CLASSE; 


A décima classe compreende os valores de 9 até 10; então, o ponto médio é 


1049 
2 


=9,5 


£) A FREQUÊNCIA DA SEGUNDA CLASSE; 
Basta consultar a tabela; a segunda classe tem frequência igual a 5. 
h) A FREQUÊNCIA ACUMULADA ATÉ A QUINTA CLASSE; 


Devemos somar as frequências das primeira, segunda, terceira, quarta e 
quinta classes. 


Assim, obtemos a frequência acumulada de: 
4+5+7+8+9=33. 


i) A FREQUÊNCIA RELATIVA DA NONA CLASSE OU INTERVALO. 


Sintese 


Adentrando no estudo da estatística descritiva, exercitamos e conceitua- 
mos neste capítulo aspectos relativos à distribuição de frequências, em que 
trabalhamos com população e amostra. Nessa construção de conhecimen- 
tos, especificamos as características das variáveis envolvidas no processo, 
as quais podem ser quantitativas ou qualitativas. Estas últimas, por sua 
vez, ainda podem ser classificadas em ordinal e nominal, enquanto as pri- 
meiras (as quantitativas) são inseridas em dois distintos grupos: as discre- 
tas e as contínuas. Como já dissemos, variáveis quantitativas são medições 
e contagens e as qualitativas são as usadas na descrição de aspectos de 
pertinência. Mas, para elaborar uma distribuição de frequência, também 
é necessário conhecer e saber determinar a quantidade de intervalos ou 
classes. E, como o objetivo é que você não apenas construa os conceitos, 
mas principalmente saiba aplicá-los, traçamos todo esse panorama através 


de exercícios práticos. 
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At Questões para revisão 


Dada a amostra: 


3-7-10-6-8-6-8-4-5-7-6-10-9-5-6-3, responda qual resul- 


tado aconteceu com a maior frequência. 
()4 ()5 ()6 
()7 ()8 


Dada a distribuição de frequências, na tabela a seguir, 


Idades Frequência (f) 
19 — 21 8 
21 L— —-23 12 
23 = 25 15 
25 L——927 13 
27 L— —329 7 
29 —— 31 


responda, assinalando entre os valores da relação abaixo, qual a fre- 


quéncia acumulada total. 
()31 (0) 55 ( )60 


( )12 ( )20 


Dada a distribuicáo de frequéncias na tabela a seguir, 


Idades Frequéncia (f) 
0 ——2 2 
2 —— 4 5 
4 L—— 6 18 
6 1——— 8 10 
8 ————10 5 


rais é crime estabelecido na Lei nº 9.610/1998 e punido pelo art. 184 do Código Penal. 
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responda, marcando entre as opções da relação que segue, qual o limite 
superior da quarta classe. 


()8 ()6 ( )10 


L )40 ()4 


4. Assinale a opção correta. Na distribuição de frequências da questão 3, 
qual a amplitude de cada classe ou intervalo? 
()10 ( )40 ()2 
(91 ()8 
5. Marque a resposta correta. Na distribuição de frequências da questão 
3, qual o ponto médio da quinta classe ou intervalo? 
()40 (22 ()8 
()5 ( )10 
6. Observe o quadro a seguir e assinale (V) para verdadeiro e (F) para falso. 
Variável 1| Variável 2 Variável 3 Variável4 | Variável 5 
Estado | Nº de depen-| Altura (em 
Empregado Naturalidade Sexo 
civil dentes centímetros) 
1 S 0 168 RJ M 
2 S 1 174 PR M 
3 C 4 170 SP F 
4 S 0 169 SP M 
5 C 3 178 SP M 
6 C 1 189 RJ M 
7 C 2 170 RS F 
8 S 0 174 SC F 
9 S 0 169 SP F 
10 C 3 177 PR M 


( ) As variáveis 1 e 4 sáo qualitativas nominais. 


( ) As variáveis 4 e 5 são qualitativas ordinais. 
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7. 


8. 


( ) As variáveis 2 e3 são quantitativas discretas. 
( ) As variáveis 2 e 3 são quantitativas contínuas. 


( ) As variáveis 1 e 5 são qualitativas nominais. 
Qual a diferença entre variável qualitativa e variável quantitativa? 


O que é uma distribuição de frequência? 
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Medidas de tendéncia 
central e de posição 


Conteúdos do capítulo 


e Como utilizar medidas de posição para resumir dados 
e A média aritmética simples para dados não agrupados 
e A média aritmética ponderada para dados agrupados 
e O valor que ocupa a posição central - mediana 

e Valor dos resultados por frequência - moda 


Após o estudo deste capítulo, vocé será capaz de: 


1. realizar cálculos com as principais medidas de posição; 


2. identificar em que situações as medidas de posição se aplicam. 


Medidas de posição 


Estudamos, nas unidades anteriores, a sintetização dos dados resultantes de 
uma pesquisa sob a forma de tabelas, gráficos e de distribuição de frequên- 
cias que nos permitiam descrever o padrão de variação de um determinado 


fenómeno estatístico. 


Agora, vamos aprender como resumir ainda mais esses dados, apresentando 
um ou mais valores que sejam representativos da série estudada. Sáo as 
chamadas medidas de posição (ou medidas de tendência central), uma vez que 
representam os fenómenos pelos seus valores médios, em torno dos quais 


tendem a concentrar-se os dados. 
Tais medidas descrevem, de alguma forma, o meio (ou o centro) dos dados. 


As medidas de posição (ou de tendência central) mais utilizadas são a média 
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aritmética, a mediana e a moda. As menos utilizadas sáo a média geomé- 


trica, a média harmônica, a quadrática, a cúbica e a biquadrática.! 


Nenhuma parte desta 


Média aritmética simples 


A média aritmética simples, ou simplesmente média, nada mais é que a 


soma dos resultados obtidos dividida pela quantidade de resultados. 
Vamos estudar inicialmente a média aritmética para dados não agrupados. 


Vamos representar a primeira observação por x, a segunda observação por 


x, (e assim por diante) e a média aritmética por X. 


Então, se tivermos n observações e desejarmos determinar o valor da média 


aritmética das mesmas, utilizaremos a fórmula: 


x X TX EX tX, +. XxX 


n 


De forma geral, representamos a média aritmética de dados não agrupados 
por: 
LX, 


n 


X= 


, em que i varia de 1 atén 


ou simplesmente representados por: 


LX 


n 


X= 


TU Exercícios Resolvidos 


Agora, vamos aplicar esses conceitos em atividades práticas para que você 


os fixe bem. 
1. Determine a média aritmética dos valores: 5, 8, 10, 12, 15. 


Verifique que, como são cinco (5) valores, somaremos os cinco e os dividire- 


mos por cinco. 


=. BR 5+8+10+12+15 


n 5 


Rzsrosra: Portanto, a média aritmética é 10. 


2. Em uma empresa de componentes eletrônicos, a exportação nos últi- 
mos quatro anos, em milhares de dólares, foi: US$ 800,00, US$ 880,00, 
US$ 760,00 e US$ 984,00. Determine a média de exportações dessa 


empresa nesses quatro anos. 


Agora, temos quatro (4) valores. Para calcularmos a média deles, somamos 


os quatro e os dividimos por quatro. 


Xe 800 + 880 + 760 + 984 
4 


— 3424 
X2. 
4 
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X = 856,00 milhares de dólares. 


Rzsrosra: Logo, a média de exportações da empresa nesses quatro anos foi 
de 856,00 milhares de dólares. 


3. Oito alunos fizeram um teste e obtiveram os seguintes resultados: 
9-6-5-8-7-9-4-8 


Qual a média desses resultados? 


— 9+6+5+84+7+9+4+8 
Ee 8 


Resposta: Portanto, a média dos resultados foi 7. 


Média aritmética ponderada 


Estudaremos agora a média aritmética para dados agrupados. 


Quando os dados estão agrupados numa distribuição de frequências, usa- 
mos a média aritmética dos valores x, x,, Xy -.., Xy ponderados pelas res- 
pectivas frequências absolutas f, f, fy ..., L. Isso significa dizer que cada 
grandeza envolvida no cálculo da média tem diferente importância ou 


aconteceu um número diferente de vezes durante a coleta de dados. 


Para isso, usamos a fórmula: 


X Y.U 
N 


X= , em que i varia de 1 até n 


Observe que N=} f. 


TU |Exercícios Resolvidos 


Vamos, então, resolver alguns exercícios com dados agrupados, para você 
construir a compreensão de seu conhecimento sobre média aritmética ponde- 
rada. 
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1. Calcule a média das idades representadas na distribuição de frequén- 
cias da Tabela 18. 


Tabela 18 — Idades de um grupo de pessoas 


Idade | Frequência (f) 
4 4 
5 6 
6 6 
y 4 


em que i varia de 1 até n 55 


— 4:4+5:6+6:6+7:4 
X= 


20 
— 16+30+36+28 
X= 
20 
— 110 
X-2——-55 
0 


Resposta: A média das idades desse grupo de pessoas é de 5,5 anos. 


lora Ibpex. A violação dos dire 


2. Calcule a média das idades representadas na distribuição de frequén- 
cias da Tabela 19. 


Tabela 19 — Idades de um grupo de pessoas 


Idades Frequência (f) 
18 |——— 21 9 
21 —— 24 12 
24 —— 27 12 
27 = 30 17 
30 —— 33 16 
38 ~~~ 36 14 
36 —— 39 11 
39 |———31 42 9 


Nesse caso, em que a variável estudada (idade) está representada em interva- 
los (ou classes), os valores de X, na fórmula da média aritmética sáo represen- 
tados pelos pontos médios (Pm) desses intervalos. Assim, temos: 
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X= 
N 

— 19,5 -9+ 22,5. 12 +25,5- 12 +28,5- 17+31,5 -16 +34,5 -14+ 37,5 -11 +40,5-9 
9+12+12+17+16+14+11+9 

= 175,5 4 270 + 306 + 484,5 + 504 + 483 + 412,5 + 364,5 
100 

— 3.000 

X < — 

100 
X - 80 anos 


Resposta: A média das idades desse grupo de pessoas é de 30 anos. 


3. Calcule a média da turma que realizou um teste de Estatística e obteve 
os resultados representados na tabela 20. 


Tabela 20 — Notas obtidas em um teste de Estatística 


Idades Frequência (f) 

0 1 4 
1 2 5 
2 3 7^ 
3 4 8 
4 5 9 
5 6 14 
6 7 8 
7 8 
8 9 
9 — 10 

5 70 


Novamente os resultados da variável estudada estão representados em inter- 
valos (ou classes); então, de novo utilizaremos os pontos médios dos intervalos, 


para determinar a média aritmética procurada. 


Nenhuma parte desta publicação poderá ser reproduzida por qualquer meio ou forma sem a prévia autorização da Editora Ibpex. A violação dos direlos autorais é crime estabelecido na Lei nº 9.610/1998 e punido pelo art. 184 do Código Penal. 


— 05:4+15:5+25:7+3,5:8+45:9+5,5:14+6,5:8+7,5:6+8,5:5+9,5:4 
4+5+7+8+9+14+8+6+5+4 


2 +7,5 + 17,5 +28 + 40,5 + 77 + 52 + 45 + 42,5 + 38 


X= 
70 
— 350 
X2—— 
70 
X=5 


Resposta: Já esse grupo de Estatística obteve a média 5. 


IMPORTANTE! É comum representar-se por X a média aritmética de 
uma amostra e por u* a média aritmética de uma população. Nós só 


utilizaremos, para os dois casos, a representação X. 


Mediana 


A mediana de um conjunto de dados é o valor que ocupa a posição central 
desses dados, desde que estejam colocados em ordem crescente ou decres- 
cente, ou seja, em um rol. 


Nós REPRESENTAREMOS A MEDIANA DE UMA AMOSTRA OU DE UMA POPULAÇÃO 
pon Md. 


E necessário, entretanto, observar que a quantidade de dados pode ser par 
ou ímpar. Sendo ímpar, o valor da mediana é o valor que está no centro da 
série; sendo par, a mediana será a média aritmética dos dois valores que 


estão no centro da série. 

VAMOS ANALISAR ALGUNS EXEMPLOS PARA O CASO DA VARIÁVEL DISCRETA. 
Calcule a mediana dos dados: 

5-8-4-6-7-3-4 

O PRIMEIRO PAsSO é colocá-los em ordem crescente: 


3-4-4-5-6-7-8 


* u éa letra grega minúscula que lemos “mu” e que corresponde à letra m do nosso alfabeto. 
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O sEGUNDO PASSO é verificar se a quantidade de dados é par ou ímpar. Nesse 


caso, é ímpar; então, a mediana é valor central da série, ou seja: 
Md =5 

Agora, 

Calcule a mediana dos dados: 

8-0-7-4-7-10-6-5 

Colocando os dados em ordem crescente, temos: 
0-4-5-6-7-7-8-10 


Como agora a quantidade de dados é par, a mediana é a média aritmética 


dos dois valores centrais da série, ou seja: 


6+7 
Md = 

2 
Md = 6,5 


Vamos analisar outra situação. 


Em uma pesquisa em que desejamos conhecer a altura dos 50 alunos de uma 
classe, os resultados obtidos nas medições, em centímetros, e colocados em 


ordem crescente foram os representados na Tabela 21. 
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Tabela 21 - Altura dos alunos de uma classe 


Alturas (cm) | Frequência (f) | Frequência acumulada (f ) 
160 2 2 
161 1 3 
162 1 4 
163 1 5 
164 2 7 
165 5 12 
166 2 14 
167 4 18 
168 4 22 
169 1 23 
170 7 30 
171 1 31 
172 2 33 
173 1 34 
174 4 38 
175 2 40 
176 2 42 
177 3 45 
178 3 48 
179 1 49 
180 1 50 

X 50 


COMO CALCULAR A ALTURA MEDIANA DESSES ALUNOS? 

O primeiro passo é determinar se n é par ou ímpar. No caso, n - 50, ou seja, é par. 
Então, a mediana será obtida por meio dos dois elementos centrais da série. 

O segundo passo é identificar, por intermédio da frequéncia acumulada, 
onde se encontram esses dois elementos, ou seja, o 25" e o 26º elementos. 
Olhando para a tabela anterior, vocé verifica que tanto o 25? quanto o 26? 


elementos tém 170 centímetros. Entáo, a mediana é: 
170 + 170 
d< ——— 
2 
Md = 170 CENTÍMETROS 
Observe que pode acontecer de, em 50 alunos, nenhum ter uma determi- 


nada medida (por exemplo, 168 cm). Nesse caso, f = 0 e os cálculos são 


efetuados como no caso anterior. 
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E, COMO FARÍAMOS ESSE CÁLCULO, SE A VARIÁVEL PESQUISADA FOSSE CONTÍNUA E 
COM OS DADOS AGRUPADOS EM CLASSES (OU INTERVALOS)? Vejamos, no exemplo se- 
guinte, a tabela anterior representada em sete classes (ou intervalos), conforme 
a tabela 22. 


Tabela 22 - Altura dos alunos de uma classe 


Alturas (cm) Frequéncia (f) | Frequéncia acumulada (f ) 
160 — — 163 4 4 
163 —— —- 166 8 12 
166 —— — 169 10 22 
169 —— — 172 9 31 
172 — 175 7 38 
175 1— — 178 7 45 
178 1— 181 5 50 
2 50 


O PRIMEIRO PAssO consiste em determinar o valor de n/2. Como a variável é 
contínua, não se preocupe se n é um número par ou ímpar. No caso, como 
n=50,n/2 é igual a 25. 


O sEGUNDO rasso é identificar em que classe (ou intervalo) está contida a 
mediana. Observando-se a tabela anterior, verificamos que o elemento de 
ordem 25 encontra-se no quarto intervalo, ou classe (cujos valores estão 


compreendidos entre 169 e 172 centímetros). 


O PRÓXIMO PASSO é O cálculo da mediana, utilizando-se a fórmula: 


n/2 — Xf 
wa-r em 


Md 
Em que: 


Li = limite inferior da classe que contém a mediana. 

n = tamanho da amostra ou da população que estamos pesquisando. 
Xf = soma das frequências anteriores à classe que contém a mediana. 
A= amplitude da classe que contém a mediana. 


fuq = frequência da classe que contém a mediana. 


Vamos, então, ao cálculo da mediana. 


(25-22) 
Md -169 + —— — .3 
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9 
Macs 


Md = 170 CENTÍMETROS 


(V. + Exercício Resolvido 


Perguntamos a idade a um grupo de 100 pessoas, com o objetivo de calcular 
a idade mediana desse grupo, e representamos os resultados obtidos na Ta- 
bela 23, a seguir, de distribuição de frequências. 


Tabela 23 — Idades de um grupo de pessoas 


Idades Frequência (f) | Frequência acumulada (f) 

18-— 21 9 9 

21-— 24 12 2] 
24 [LL—— 27 12 33 
27 —— 30 17 50 
30 |——— 33 16 66 
33 |LL—— 36 14 80 
36 —— 39 11 91 
39 -—— 4,42 9 100 

» 100 


Nesse caso, o primeiro passo é determinar n/2 = 100/2 = 50. 


O segundo passo é verificar a classe em que se encontra o 50º elemento da 
série. No caso, está na quarta classe, cujas idades vão de 27 a 30 anos. Não 
se preocupe se o intervalo é aberto ou fechado. 


O terceiro passo é utilizar a fórmula para o cálculo da mediana. 
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(n/2 - Xf, ) -A 


Md = Li+ 
m 
50-33 
ideia 10-99). 
17 
Md =27+ 2L 
17 


7 
Resposta: Md = 30 anos 3 


Moda 


Como vocé percebe, andando na rua, que uma roupa está na moda? 


Vocé percebe isso porque vé muitas pessoas com aquela roupa. Em outras 
palavras, é uma roupa que aparece com muita frequéncia. 


Evidentemente, esse é um exemplo bem simplista. 


Na estatística, nós definiremos moda como sendo o valor dos resultados 
de uma pesquisa que acontece com a maior frequência e a representa- 


remos por Mo. 


Nas distribuições sem o agrupamento em intervalos (ou classes), a simples 
observação da coluna das frequências nos permite saber qual é o elemento 
da série que apresenta a maior frequência e que, portanto, é o valor que 
está na moda; nós o chamamos de VALOR MODAL. 


Assim, para a distribuição 


X, f; 
5 

6 5 
i 11 
8 10 
9 5 


a moda é o 7. Representa-se por Mo - 7. 


Para os dados agrupados em intervalos (ou classes), a determinação do 


valor modal também é simples, porém mais trabalhoso; trata-se de um 


Q 
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processo semelhante ao utilizado para o cálculo da mediana. 


Na realidade, existe mais de um método para a determinação da moda. 


E 
É 


O mais simples e, consequentemente, mais impreciso, é considerar como 
moda o ponto médio da classe que contém a moda, também denominada 
de classe modal; esse valor chama-se MODA BRUTA. 


Podemos, ainda, determinar a moda mediante o uso de fórmulas ou de 
gráficos. Para tal, temos o método de King e o método de Czuber*. Nós 
utilizaremos o método de King. 


* Emanuel Czuber, nascido em Praga (1851-1925). 


Determinaremos a moda da distribuicáo de frequéncias representada na 
Tabela 24. 


Tabela 24 — Idades de um grupo de pessoas 


Idades Frequência (f) | Frequência acumulada (f) 

18 — 21 9 9 

21 —— 24 12 21 
24 |LL— 27 12 38 
27 |——— 30 17 50 
30 —— 33 16 66 
33 | L——— 36 14 80 
36 —— 39 11 91 
39 — 42 9 100 

X 100 


O PRIMEIRO PASSO consiste em identificar em que classe se encontra a moda, 
ou seja, qual é a classe modal. No caso, é a quarta classe (idades de 27 a 30 


anos), pois é a que apresenta a maior frequência de ocorrência (f = 17). 


O sEGUNDO Passo é a determinação do valor da moda por meio da fórmula: 


post 


f 


ant post 


Mo = Li + 


Em que: 
Li = limite inferior da classe que contém a moda. 
fios = frequência da classe posterior à classe que contém a moda. 
f „= frequência da classe anterior à classe que contém a moda. 


A - amplitude da classe que contém a moda. 


Vamos, agora, substituir os elementos dessa fórmula pelos valores do nosso 


problema; assim, temos: 


16 


Mo-227* ———.3 
12-416 
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48 
Mo = 27 + — 
28 


Mo = 28,7143 anos. 


IMPORTANTE! Sendo conhecidas a média aritmética e a mediana de 
uma série, é possível obtermos o valor da moda pela aplicação da fórmula 


de Pearson*, em que: Mo = 3. Md - 2 - X 


Essa fórmula nos dá o valor aproximado da moda e só deve ser utilizada 


quando a distribuição apresentar razoável simetria em relação à média. 


Vamos, agora, determinar a moda da distribuição de frequências representa- 
da na Tabela 25. 


Tabela 25 — Alturas de um grupo de pessoas 


Alturas (cm) Frequência (f) | Frequência acumulada (f) 
160 |. 163 4 4 
163 |L——— 166 8 12 
166 |... 169 10 22 
169;— 172 9 31 
172 —— 175 7 38 
175 |LL— 178 C 45 
178 œŒ 181 5 50 
» 50 


O PRIMEIRO PASSO é a constatação, visual, da classe que contém a moda. No 


caso, a classe modal é a terceira, cuja frequência de ocorrência é igual a 10. 


Então, a moda é: 


Mo = 166 + -3 


8+9 


Mo = 166 + 1,588 


Mo = 167,588 CENTÍMETROS. 


* Karl Pearson, nascido em Londres (1857-1936), foi um grande contribuidor para o desenvolvi- 


mento da Estatística como uma disciplina científica séria e independente. 
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IMPORTANTE! Pode ocorrer que uma série apresente mais de uma 


moda. A plurimodalidade pode ocorrer em função de: 


dados pertencentes a populações diferentes; 


insuficiéncia de dados para análise; 


quantidade inadequada de classes (ou intervalos). 


At Sintese 


A significativa importância das medidas de posição está no fato de permiti- 


rem reduzir as variáveis de uma série estudada a um ou mais valores. Isso 


é possível, pois, como você viu, elas nos permitem estabelecer os valores 


médios. Para realizar tal processo, precisamos trabalhar com a média arit- 


mética simples, no caso de dados não agrupados, e com a média aritméti- 
ca ponderada, quando utilizamos dados agrupados. Outros conceitos que 
precisamos dominar e saber calcular no processo estatístico são os de me- 


diana e de moda, razão pela qual utilizamos vários exemplos para facilitar 


a elaboração de sua compreensão dos cálculos e usos desses saberes. 


71 Questões para revisão 


1. Assinale, nos parênteses, a opção correta. Dados os valores a seguir, 


9-6-5-4-8-9-10-4-7-8-5-6-10, 


determine a média aritmética deles. 


()9 ()75 


()85 ()7 


()65 


2. Em uma pesquisa realizada em uma empresa quanto aos salários mé- 


dios de seus funcionários, verificou-se o seguinte resultado: 


Salários (R$) Frequéncia (f) 
240,00 — 480,00 15 
480,00 ——— 720,00 22 
720,00 ————- 960,00 30 
960,00 —— 1.200,00 18 

1.200,00 — —34 1.440,00 15 
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5. 


Baseado nesses resultados, determine o salário médio desses funcio- 


nários e marque a resposta correta nas opções abaixo. 
( ) R$ 720,00; ( ) R$ 840,00; 
( ) R$ 830,40; ( ) R$ 1.000,00. 


( ) R$ 954,60; 


Dados os valores a seguir, 
9-6-5-4-8-9-10-4-7-8-5-6-10, 


determine a mediana dos mesmos e assinale, na relação abaixo, a res- 
posta correta. 


()7 ()9,5 ()6 

( ) 10 ()75 

Assinale a resposta correta, após determinar, pela fórmula, a mediana 
da distribuição apresentada no exercício 2. 

( ) R$960,00; ( ) R$ 840,00; 

() R$720,00; () R$ 828,00. 

( ) R$ 824,00; 

Marque a opção correspondente, após determinar, pela fórmula, a 
moda da distribuição apresentada no exercício 2. 

( ) R$ 960,00; ( ) R$ 840,00; 

( ) R$ 720,00; ( ) R$ 828,00. 


( ) R$ 824,00; 
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6. 


As exportações de determinado porto brasileiro registraram o seguinte 


movimento, em bilhões de reais, mês a mês, durante um ano: 


Mês R$ 
Janeiro 3,0 
Fevereiro 24 
Março 2,8 
Abril 3/1 
Maio 2,4 
Junho 3:2 
Julho 2,6 
Agosto 2,5 
Setembro 3,4 
Outubro 3,4 
Novembro 3,3 
Dezembro 3,6 
X 36,0 


Qual foi a média mensal de exportacóes, em bilhóes de reais? Marque a 


alternativa correta. 


()3,0 


(J29 


()32 ( )2,6 


( )360 


O comércio varejista de calcados registrou as seguintes encomendas, 


em milhares de pares, em uma determinada indústria calçadista, ao 


longo de um semestre: 


Més Pares encomendados 

1? més 48 
2? més 60 
3? més 42 
4? més 50 
5? més 64 
6? més 66 

X 330 
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Qual a média mensal de encomendas, em milhares de pares de calçados? 


Assinale a média correta. 

()42 ()33 ( ) 330 

( )50 ()55 

O Departamento de Marketing e Propaganda de uma multinacional 


investiu, durante um ano, os seguintes valores em campanhas publici- 


tárias, em milhares de reais: 


Mês R$ 
Janeiro 20 
Fevereiro 12 

Março 8 
Abril 24 

Maio 0 
Junho 16 
Julho 18 
Agosto 20 
Setembro 12 
Outubro 15 
Novembro 13 
Dezembro 22 
X 180 


Qual foi a média mensal de investimento, em milhares de reais? Assinale 


a alternativa correta. 
()18 012 ()20 


()15 ( )17 
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9. Determinada máquina produziu durante oito dias as seguintes quanti- 
dades de peças (em unidades): 


Dia Unidades 
1? 140 
29 136 
9? 142 
4? 128 
5? 154 
6? 140 
7? 158 
8? 170 
X 1.168 


Qual a média diária de producáo dessa máquina? Assinale a resposta 


correta. 
( ) 128 ( ) 141 ( ) 146 
( ) 154 ( ) 140 


lora Ibpex. A violação dos dire 


10. Uma secretária fez uma pesquisa de preço para a aquisição de uma 


impressora da marca X e obteve os seguintes valores, em reais: 


Loja Valor (R$) 


A 484,00 
399,00 
505,00 
383,00 
429,00 


tà m QU Cw 


2.200,00 


Qual o preco médio dessa pesquisa? Assinale a resposta correta. 
( ) 505,00 ( ) 440,00 ( ) 399,00 


( ) 484,00 ( ) 444,00 


11. Para que servem as medidas de posição? 


12. Descreva a diferença entre média aritmética simples e média aritméti- 


ca ponderada. 
75 


leuad oBpoo op pgi "Ve ojad opiund a 8661/0196 sU 187 eu opoejeqejse euro e sreiojne SOJBI!P sop OBÍEIIA v 790 eio ep ogsezuojne eaud e was euo no OI Jenbfenb Jod epzznpoida js euapod ogôeoyqnd ejsep sped euinuuev 


U 


Medidas de dispersão 


Conteúdos do capítulo 
e Conceito e uso das medidas de dispersão. 
e Us fenômenos de amplitude total, amplitude semi-interquartílica, 
desvio médio, variância e desvio padrão. 


Após o estudo deste capítulo, você será capaz de: 


1. realizar cálculos com as principais medidas de dispersão; 
2. identificar as medidas de dispersão. 


Medidas de dispersão 


As medidas de dispersão (ou de afastamento) são medidas estatísticas utili- 
zadas para verificar o quanto os valores encontrados em uma pesquisa estão 


dispersos ou afastados em relação à média ou em relação à mediana. 


São medidas que servem para verificar com que confiança as medidas de 
tendência central resumem as informações fornecidas pelos dados obtidos 


em uma pesquisa. 


Imaginemos, por exemplo, duas pessoas que tenham se submetido a um 


teste. Suponhamos duas situações diferentes: 
a) as duas pessoas tiraram nota igual a 6,0; 
b) as duas pessoas tiraram, respectivamente, nota 2,0 e nota 10,0. 


Nos dois casos, as duas pessoas obtiveram média igual a 6,0. No entanto, 


no caso “a” elas se concentraram sobre a média e no caso “b” dispersaram- 


È 
8 
8 
8 
8 
8 
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E 
E 
$ 
i 
à 
8 
$ 
E 
2 
É 
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E 
E 
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E 
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se (afastaram-se) da média. 


Isso significa dizer que a média é muito mais representativa no caso "a" do 


Nenhuma parte desta 


Mat 


que no caso “b”. Mostra, também, que no caso “a” existe uma homogenei- 
dade nos conhecimentos adquiridos pelas pessoas, enquanto no caso “b” 
existe uma heterogeneidade. 


Para avaliarmos o grau de variabilidade (ou dispersão, ou afastamento) 


dos valores de um conjunto de nümeros, utilizamos as medidas de disper- 


são absoluta, que nos permitem obter um conhecimento mais completo e 


detalhado do fenômeno em questão. São elas: 


a) amplitude total ou intervalo total; 


b) amplitude semi-interquartílica, ou intervalo semi-interquartílico, ou 


desvio quartil; 


c) desvio médio; 


d) variância; 


e) desvio padrão. 


Amplitude total (ou intervalo total) 


A AMPLITUDE TOTAL (ou intervalo total) é a diferença entre o maior e o me- 


nor valor de uma série de dados. Por exemplo, no conjunto de números 


4, 6, 8, 9, 12, 17, 20, a amplitude total será A = 20 - 4 = 16. 


Para o caso dos dados estarem agrupados em classes (ou intervalos), o 


cálculo da amplitude total pode ser feito de duas formas: 


a) pelo PONTO MÉDIO DAS CLASSES; nesse caso, a amplitude total é igual ao 


ponto médio da última classe, menos o ponto médio da primeira classe; 


b) pelos LIMITES DAS CLASSES; nesse caso, a amplitude total é igual ao limite 


superior da última classe, menos o limite inferior da primeira classe. 


Por exemplo, veja a distribuição de frequências representada na tabela 26. 


Tabela 26 — Idades de um grupo de pessoas 


Idades Frequência (f) 
18 1—— 21 9 
21 =—— 24 12 
24 —— 27 12 
27 1—— — 30 17 
30 —— 33 16 
33 1— — 36 14 
36 1— — 39 11 
39 =~ 42 9 
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A amplitude total é: 

a) pelo ponto médio das classes, 

A=40,5-195=21 

b) pelos limites das classes, 

A=42-18=24 

À AMPLITUDE TOTAL (ou intervalo total), embora seja a medida de dispersão 
mais simples, apresenta algumas restrições quanto ao seu uso, porque é 
muito instável. Essa instabilidade ocorre em virtude da amplitude total le- 


var em consideração apenas os valores extremos da série, não sendo afetada 


pela dispersão dos seus valores internos. 


Amplitude semi-interquartílica 


Antes de explicarmos o que é AMPLITUDE SEMI-INTERQUARTÍLICA, é necessá- 
rio esclarecer que temos medidas de posição semelhantes — na sua concep- 
ção — à mediana, apesar de não serem medidas de tendência central. São 


elas os quartis, os decis e os percentis. 


Os quarTIS permitem dividir a distribuição em quatro partes iguais, ou 
seja, com o mesmo número de elementos. Assim, os DECIS dividem a dis- 
tribuição em dez partes iguais e os PERCENTIS em cem partes iguais. Em 
relação aos quartis, representamos a seguir um conjunto de dados em que 
seus elementos foram divididos em quatro partes iguais: 
0% 25% 50% 7596 10096 

i 1 | | 


O OQ Q 


Em que: 


Q, = primeiro quartil (Q, é a mediana de todos os valores inferiores à 


mediana do conjunto de dados). 
Q, - segundo quartil (coincide com a mediana). 


Q, = terceiro quartil (Q, é a mediana de todos os valores superiores à 


mediana do conjunto de dados). 


Para o cálculo de Q,, Q, e Q, usamos, quanto às fórmulas, a seguinte se- 
quéncia: 

(n/A- Xf )-A 
+ 


fo, 


ant 


Q, = 
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(n/2- Xf )- A 
Q,= E : 
Q 
3n/A- Xf )-A 
Q,=Li+ ( n m 
fo, 


A AMPLITUDE SEMI-INTERQUARTÍLICA, também denominada de intervalo semi- 
interquartílico ou de desvio quartil, é utilizada para verificar a dispersão em 
relação à mediana. Seu cálculo leva em consideração o primeiro e o tercei- 


ro quartis e é efetuado pela fórmula: 


_ Q-Q, 
EET 


Em que: 
D, = desvio quartil. 
9 
Q, = terceiro quartil. 
Q, = primeiro quartil. 


É importante observarmos que no desvio quartil, no intervalo definido pe- 
los limites (Md - D.) e (Md + D ), encontram-se 50% dos elementos, aproxi- 


madamente. Se a distribuição for simétrica, essa porcentagem será exata. 


Outra grande importância do desvio quartil é o fato de ser uma medida 
que não é afetada pelos valores extremos da série, sendo, portanto, útil 


quando esses valores extremos não forem representativos. 


Como exemplo de aplicação, vamos supor que uma turma de alunos fez um 
teste de Estatística e um teste de Matemática, nos quais obteve os seguintes 
resultados: 


a) Estatística: Md = 6, Q, = 45, Q} - 7,5 
b) Matemática: Md = 6, Q, 23, Q 27,5 


Observamos que nos dois testes a mediana foi igual a 6,0. No entanto, as 
notas de Estatística apresentam uma dispersáo menor que as notas de Ma- 


temática. 


Quanto aos decis, representamos, a seguir, um conjunto de dados em que 


seus elementos foram divididos em dez partes iguais. 
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0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% 
| i i i i i | 


D D D D D. D D D D 


il 2 3 4 5 6 7 8 9 


Em que: 
D, = primeiro decil. 
D, = segundo decil. 
D, = nono decil. 


Finalmente, quanto aos percentis, representamos a seguir um conjunto de 


dados em que seus elementos foram divididos em 100 partes iguais. 


0% 196 296 396 97% 98% 99% 10096 
Pi P. P3 Ps Pos Pos 
Em que: 


p, = primeiro percentil. 
p, = segundo percentil. 
p, = terceiro percentil. 


Pos = nonagésimo oitavo percentil. 


Po = nonagésimo nono percentil. 


De acordo com Lapponi!, após ordenar a série de n observações em ordem 
crescente de valores, definimos como 0% a posição da observação de or- 
dem 1 e como 100% a posição da observação de ordem n. 


Gráfico 6 — Ordenamento de uma série de n observações 


Posição 
À 


100% | | 


0% 


~> Ordem da série 


E 
E 
E 
H 
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COMO CALCULAR O PERCENTIL CORRESPONDENTE AO VALOR DE ORDEM X? 


Esse cálculo é efetuado a partir da expressão: 


- 100 % 


p= 


n-1 
Em que: 


n = número total de observações da série. 
x= ordem de uma determinada observação. 


p = percentil (em percentual) da observação. 


TU c Exercício Resolvido 


1. Vamos supor uma série de 20 observações registradas no quadro a 
seguir e calcular: qual o valor do percentil cuja ordem é x = 1? e, qual 
o valor do percentil cuja ordem é x = 8? 


8 27 18 22 24.10. 11. .9— =17 M6 
29 26 20 13,28 30 12 21 154 25 


Vamos colocar essa série ordenada de forma crescente e associar a cada valor 


da série um nümero de ordem de 1 a 20. 


Observação da série | 8 9 10 11 12 13 15 16 17 18 


Nümerodeordem |1 2 3 4 5 6 7 8 9 10 


Observação da série | 20 21 22 24 25 26 27 28 29 30 


Nümerodeordem | 11 12 13 14 15 16 17 18 19 20 


QUAL O VALOR DO PERCENTIL CUJA ORDEM É X= 1? 


171 400% 
P= 0- ° 
p=0% 


E QUAL O VALOR DO PERCENTIL CUJA ORDEM É X = 8? 
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= 100 96 
P -1 
p= —— : 100 % 
p = 36,8% 


Desvio médio 


Quando desejamos analisar a dispersão (ou afastamento) dos valores de 
uma série em relação à média, é conveniente analisar essa dispersão de 
cada um dos valores, sem exceção. Assim, chamaremos Dm de desvio médio 


e o calcularemos pela fórmula: 


2 IX,-XI- f, 
N 


Dm = 


Em que | X, - X [é o módulo de cada desvio em relação à média, i varia de 
latén e N é igual a Xf. 


IMPORTANTE! Estamos trabalhando com o módulo do desvio porque, 
de acordo com a propriedade de média aritmética, a soma de todos os 
desvios em relação à média é sempre igual a zero. Trabalhando com o 


módulo (que é sempre positivo), eliminamos esse problema. 


Pela fórmula acima, deduzimos que o desvio médio nada mais é do que a 
média aritmética dos desvios dos valores em relação à média, considera- 


dos em valor absoluto. 


Como exemplo de aplicação, calculemos o desvio médio do seguinte con- 


junto de números: 
4, 6, 8,9, 10, 11 
Inicialmente, devemos calcular a média aritmética dos valores dados: 


— 4+6+8+9+10+11 
6 


X=8 


Temos, então: 
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x 
x 
| 
x| 
x 
I 
x 


+ 4-8-2-4 4 
6 6-8=-2 2 
8 8-8=0 0 
9 9-8=1 1 
10 10-8=2 2 
11 11-823 3 
X 0 12 


Observe que, nesse exemplo, todos os valores ocorreram uma ünica vez. 


Por isso, em todos eles a frequéncia f foi considerada igual a 1. 


Para dados agrupados em classes ou intervalos, substitui-se X, na fórmula, 
pelo ponto médio de cada classe. 


VAMOS AGORA CALCULAR O DESVIO MÉDIO DA DISTRIBUIÇÃO DE FREQUÊNCIAS DA 


TABELA 26. 


O PRIMEIRO PAssO consiste em calcular a média das idades. Observe que tal 
média já foi calculada na página 55, quando verificamos que X=30. Vamos, 
então, verificar o quanto cada idade está afastada da média ( X, - X ). 

O sEGUNDO Passo é montar uma tabela com cálculo do desvio de cada idade 
em relação à média encontrada. Não esquecer que, para o cálculo do desvio 
médio, é necessário multiplicar o módulo de cada desvio encontrado pela 
respectiva frequência (L. 


Tabela 27 - Desvio médio de cada idade em relação à média 


Idades Frequência (f) X, -X X= XI. L 
18 L 21 9 19,5 -302- 10,5 10,5-9=94,5 
21 —— 24 12 22,5 -30 =-7,5 7,5 -12=90 
24 —— 27 12 25,5 - 30 =- 4,5 4,5 : 12 =54 
27 —— 30 17 28,5 -30 =-1,5 1,5 - 17 = 25,5 
30 | —— 33 16 31,5 -30 =+1,5 15-16-24 
33 .— — 36 14 345 - 30 = + 4,5 4,5 -14=63 
36 | — 39 11 37,5-30=+7,5 7,5:11=82,5 
39 —— 42 9 40,5 - 30 = + 10,5 10,5-9=94,5 

b» 100 528 
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O desvio médio dessa distribuição de frequências é igual a: 


LIX-XI-f 
Dm=: ——— ue 
N 
528 
Dm= —— 
100 
Dm =5,28 


Variância (S?) 


Já vimos que a soma dos desvios em relação à média é sempre igual a 
zero. Por isso, consideramos os valores de X, - X em módulo. Outra for- 
ma de evitarmos que esse fato interfira nos nossos cálculos é considerar 
cada desvio elevado ao quadrado, pois sabemos que o quadrado de qual- 
quer nümero real é sempre positivo. 


A média aritmética dos quadrados dos desvios damos o nome de variância. 


Sua fórmula, quando se trata de população, é: 


X(X-Xy.f 
N 


S= 


Para o cálculo da variância de uma amostra, o denominador dessa fórmula 
deverá ser (N - 1), ou seja: 
X(X-Xy.f 
N-1 


S= 


Por que (N - 1)? 


Caso tomássemos muitas amostras de uma população que tem média u e 
calculássemos as médias amostrais X de todas essas amostras, verificaría- 


mos que a média dessas médias amostrais ficaria muito próxima a p. 


Entretanto, se calculássemos a variância dessas amostras pela fórmula 


z(X,-Xy-f, 
N 


S= 


e, então, determinássemos a média dessas variáveis, verificaríamos que 


essa média é menor que a variância da população. Teoricamente, pode 
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ser mostrado que podemos compensar isso dividindo a fórmula de S? 
por (N - 1), quando se tratar de uma amostra? 


Verifica-se, segundo Toledo e Ovalle?, entretanto, que para valores gran- 
des de N (N » 30) nào há grande diferença entre os resultados proporcio- 
nados pela utilização de qualquer dos dois divisores, N ou (N - 1). 


Desvio padrão (S) 


O cálculo da variância é, na verdade, um passo intermediário para o cál- 


culo do que denominamos de desvio padrão. 


Para o cálculo de S, vamos extrair a raiz quadrada da variância para com- 
pensar o fato de termos elevado ao quadrado os desvios em relação à 


média. 


O Desvio PADRÃO é a medida de dispersão mais utilizada na prática, con- 
siderando, tal qual o desvio médio, os desvios em relação à média. Nós 


o representamos por S. 


Para que o desvio padrão tenha um significado quantitativo, vamos 
adiantar conceitos que não fazem parte do presente capítulo, mas que 


você pode estudar quando achar necessário. 


Para um conjunto de dados obtidos por amostragem, de uma população 
a que denominamos de normal, verificamos que, quando a amostra é sufi- 
cientemente grande, o intervalo compreendido entre os valores (X - S) e 
(X + S) inclui aproximadamente 68,26% dos resultados obtidos na pesqui- 
sa e o intervalo compreendido entre (X - 2 - S) e (X + 2 - S) inclui apro- 
ximadamente 95,44% desses resultados. Se considerarmos o intervalo 
compreendido entre (X - 3 - S) e (X + 3. S), temos cerca de 99,74% dos 
resultados, ou seja, quase a totalidade das observações efetuadas. 


Caso façamos o histograma correspondente, vemos que ele se aproxima de 
uma curva denominada de curva de Gauss, ou curva em forma de sino, ou, ain- 


da, curva normal. 


Para o cálculo do desvio padrão de uma população temos a fórmula: 


z(X-Xy.f 


N 
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A fórmula para o cálculo do desvio padráo da amostra é, portanto: 


" x(X-Xp.f 
N-1 


Lembrar que V ?- S 


TU "Exercícios Resolvidos 


1. Oito empregados de uma Siderúrgica que exercem a mesma fun- 
ção têm os seguintes salários: R$ 2.800,00; R$ 2.650,00; R$ 2.920,00; 
R$ 2.800,00; R$ 2878,00; R$ 2.682,00; R$ 2.700,00; R$ 2.570,00. Qual seria 
o padrão desses salários, considerando-os como uma população? 


S 2800 + 2650 + 2920 + 2800 + 2878 + 2682 + 2700 + 2570 
8 


(2800 - 2750} + (2650 - 2750} + (2920 - 27507 + (2800 - 2750} + (2878 - 2750) + (2682 - 2750) + (2700 - 2750) + (2570 - 2750} 


8 


2500 + 10000 + 28900 + 2500 + 16384 + 4624 + 2500 + 32400 
8 


S? = 12.476,00 

Observar que a frequência foi considerada sempre igual a 1. 
Então: 

S = \ 12476 

S=111,70 


2. Considerando-se agora que a tabela 28 é uma amostra das idades de um 
grupo de pessoas, vamos determinar o desvio padrão da distribuição. 


Sabemos que: 


X(X-Xy.f 
N-1 


estabelecido na Lei n° 9.610/1998 e punido pelo art. 184 do Código Penal. 


ou forma sem a prévia autorização da Editora lopex. A violação dos direitos autorais é crime 
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Sabemos, também, que X=30 


Tabela 28 — Quadrado do desvio médio de cada idade em relação à média 


Idades Frequência (f) | X,- XI (1X, =X P£ 
18 L 21 9 19,5 - 30 = 10,5 10.57 - 9 = 992,25 
21H-— 24 12 25,5-30=7,5 7,52. 12 = 675 
24 1— — 27 12 22,5-30=4,5 4,52. 12 = 243 
27 —— — 30 17 285-30-1,5 1,5? - 17 = 38,25 
30-— 33 16 31,5-30=1,5 1,5° -16 =36 
33 — — 36 14 34,5 - 30 = 4,5 4,5? - 14 = 283,5 
36 — — 39 11 37,5 - 30 =7,5 7,5” - 11 = 618,75 
39 ——3142 9 40,5 - 30 = 10,5 10,5? - 9 = 992,25 

L 100 3.879 


Então, de acordo com os valores obtidos na Tabela 28, o desvio padrão 
procurado é: 


3879 
s= V —— 
99 


Resposta: S = 6,26 


3. Dada a tabela a seguir, em que constam as medidas obtidas em uma 
população quanto aos seus salários recebidos (em quantidade de salá- 
rios mínimos), vamos determinar o desvio padrão da distribuição. 


Tabela 29 — Salários de uma população observada 


Salários mínimos | Nº de pessoas (f) | | X;- XI IX, -XI2: f 
1——3 15 6,5 633,75 
31——5 12 45 243 
95—— 7 20 2,5 125 
7———9 23 0,5 5,75 
9 mU 28 15 63 

11^ — 13 19 3,5 232,75 
13 — 15 19 55 574,75 
X 136 1.878 
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E 15.2+12.4+20.6+23.8+28-.10+19.12+19.14 


136 

— 1156 
X2 —— 

136 
X=85 

1878 
S?- — — : S2-13,8088 

136 


Resposta: S= NS? :. S=3,716 SALÁRIOS MÍNIMOS 


A Sintese 


Quando falamos que medidas de dispersão são aquelas que servem para 


verificar o quanto os valores encontrados em uma pesquisa estão disper- 
sos em relação ao foco central, estamos definindo sua aplicabilidade, sem 
dúvida; no entanto, não podemos deixar de enfatizar o que isso repre- 
senta, ou seja, é o padrão que nos permite estabelecer o grau de confiança 
de uma pesquisa. Nessa avaliação do grau de variabilidade do fenômeno 
estudado, encontramos como ferramentas de medição a amplitude total, 
a amplitude semi-interquartílica, o desvio médio, a variância e o desvio 


padrão. 
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At Questões para revisão 


Dado o conjunto de números 
8, 4,6,9,10,5, 


determine o desvio médio desses valores em relação à média e assinale 


nas opções (abaixo) o resultado. 
()12 ()0 L 17 
()2 ()6 


Determine a variância do conjunto de números da questão 1, supondo 


que esses valores correspondam a uma amostra, e marque a alternativa 


correta. 
( )28 ()7 ()5,6 
( ) 2,3664 ( )28 


Determine o desvio padrão do conjunto de números da questão 1, su- 
pondo que esses valores correspondam a uma amostra, e assinale a 


alternativa correta. 
()28 A7 ()56 


( ) 2,3664 ()28 


Marque a resposta correta. Qual a amplitude total dos dados da questão 1? 
()42 ()6 ()4 

()3 ( )10 

Determine a amplitude semi-interquartílica de uma distribuicào de fre- 


quéncias cuja média foi 6, a mediana foi 6,5, o primeiro quartil foi 45 e o 
terceiro quartil foi 8,5. Assinale nas opções (abaixo) a alternativa correta. 


()2 ()45 ()25 


()65 ()6 
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6. 


10. 


A tabela a seguir é o resultado de uma pesquisa realizada entre os 
funcionários de uma empresa de exportação e importação de produ- 
tos eletrónicos, com o objetivo de verificar os salários nesse segmento 
de mercado. Determine o desvio médio desses salários em relação à 


média. Calcule utilizando-se de duas casas após a vírgula. 


Salários (em salários mínimos) Funcionários 
1—2 1 
21——3 4 
3 — —4 6 
4—5 5 
5—6 6 
6—7 10 
7 — 8 9 
8—9 
9—10 
2 50 
( ) 1,80 ( ) 88,00 ( ) L76 
( ) 433 ( ) 2,08 


Determine a variância do conjunto de valores da questão 6, supondo 
que os mesmos correspondem à população total. Calcule com duas 
casas após a vírgula. 


( ) 216,50 () 433 () 4,42 
() 14,71 ( ) 2,08 
Determine o desvio padrão do conjunto de valores da questão 6, su- 


pondo que os mesmos correspondem à população total. Calcule com 
duas casas após a vírgula. 


( ) 216,50 ( )433 ()442 
() 14,71 ( ) 2,08 
Qual o uso das medidas de dispersão na estatística? 


Quais são os tipos de medidas de dispersão? 


lora Ibpex. A violação dos dire 
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Medidas de assimetria 
e medidas de curtose 


Conteúdos do capítulo 


e Medidas de assimetria 
e Medidas de curtose 


Após o estudo deste capítulo, você será capaz de: 


1. realizar cálculos com as principais medidas de assimetria; 


2. realizar cálculos com as principais medidas de curtose. 


Medidas de assimetria 


A média corresponde ao centro de gravidade dos dados; a variância e o des- 
vio padrão medem a variabilidade, mas a distribuição dos pontos sobre um 
eixo ainda tem outras características, que podem ser medidas — uma delas 
é a assimetria.! 


AS MEDIDAS DE ASSIMETRIA, também denominadas de medidas de enviesamen- 


to, indicam o grau de deformação de uma curva de frequências. 


Uma distribuição de frequências ideal seria aquela em que a curva resul- 
tante fosse rigorosamente simétrica, o que dificilmente acontece na prática. 


Nesse caso, a média, a mediana e a moda seriam iguais. 


Também os quartis Q, e Q, nesse caso, ficariam equidistantes da mediana. 
Entretanto, se a distribuição de frequências for assimétrica, esses fatos não 


ocorrem. 


A assimetria da curva correspondente a uma distribuição assimétrica pode 
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apresentar uma deformidade à direita ou à esquerda. No caso de a de 
formidade ser à direita, a curva é dita assimétrica positiva ou desviada à 
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direita; no caso de a deformidade ser à esquerda, a curva é dita assimétrica 
negativa ou desviada à esquerda. 


Não é comum encontrar a assimetria negativa e não é fácil identificar suas 


possíveis causas.? 


A seguir, temos um exemplo gráfico de uma distribuição simétrica, uma 


distribuição assimétrica positiva e uma distribuição assimétrica negativa. 


Gráfico 7 — Distribuição simétrica e assimétrica 


> X 
X = Md = Mo 
Distribuição simétrica 
92 =x 
Z Z 
Distribuição assimétrica negativa 
> X 


Distribuição assimétrica positiva 


Observe que, em uma distribuição assimétrica negativa, X « Md < Mo e, 
em uma distribuição assimétrica positiva, X > Md > Mo. Na distribuição 


simétrica essas três medidas são iguais. 


Para determinarmos o grau de assimetria de uma distribuição de frequên- 
cias, são propostas várias fórmulas que nos permitem calcular o coeficien- 
te de assimetria. Entre elas, estudaremos o coeficiente sugerido por Karl 


Pearson. 


Pearson definiu O PRIMEIRO COEFICIENTE DE ASSIMETRIA pela fórmula: 
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Como vimos no capítulo 4, 

Mo=3:Md-2:X 

Então, podemos dizer que (multiplicando toda a igualdade por — 1): 
-Mo--3.Md*2.X 

E somando X nos dois lados da igualdade, teremos: 
X-Mo=-3.Md+2.X+X 

Então: 

X-Mo--3.Md«3.X 

ou 

X- Mo -3-(X- Md) 

Substituindo essa última expressão na fórmula de As, teremos: 


| 3-(X-Ma) 
-— 


As 
Essa fórmula foi definida como o SEGUNDO COEFICIENTE DE ASSIMETRIA de 
Pearson. 


Quando As é igual a zero, diz-se que a distribuição de frequências é simé- 
trica; caso As seja positivo, a distribuição é assimétrica positiva ou à direita; 
caso As seja negativo, a distribuição é assimétrica negativa ou à esquerda. 


Vamos a alguns exemplos para você entender melhor este assunto. 


TU Exercícios Resolvidos 


1. Numa distribuição de frequências que apresentou média igual a 6, me- 
diana igual a 6 e desvio padrão igual a 1, determinar o coeficiente de 
assimetria dessa distribuição. 


Como não conhecemos a moda, vamos utilizar a fórmula do segundo coe- 


ficiente de assimetria de Pearson. 


| 3-(X-Ma) 
= 


As 
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Resposta: Deduzimos, do resultado de As, que a distribuição é simétrica. 


2. Suponhamos, agora, que uma distribuição de frequências tenha apre- 
sentado média igual a 88, mediana igual a 82 e desvio padrão igual a 


40; vamos determinar o coeficiente de assimetria dessa distribuição. 


Novamente utilizaremos o segundo coeficiente de assimetria de Pearson. 


3. (X- Md) 
n 8 


3.(88—-82 
ipu E 


40 
18 
Ags- 
40 
As =0,45 


RESPOSTA: LOGO, O COEFICIENTE DE ASSIMETRIA DESSA DISTRIBUIÇÃO É 0,45. 


3. Agora, vamos determinar o coeficiente de assimetria para uma distri- 
buição que apresentou moda igual a 15, média igual a 13 e desvio pa- 
drão igual a 5. 


Como não conhecemos a mediana, utilizaremos o primeiro coeficiente de 


assimetria de Pearson. 


X-Mo 
As- 
S 
13- 15 
s= 
5 
As =- 0,40 


RESPOSTA: PORTANTO, O COEFICIENTE É 0,40. 


Na impossibilidade de usar o desvio padrão como medida de dispersão, 
Pearson sugeriu outra medida de assimetria: é O COEFICIENTE QUARTIL DE 


ASSIMETRIA, determinado pela fórmula: 
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Q, * Q, -2- Md 


EN 
j Q.-Q. 


Medidas de curtose 


Diante de um conjunto de dados e desejando efetuar uma análise criteriosa 
deles, algumas características são importantes para podermos tomar algu- 
ma decisão. Entre elas, destacamos as medidas de posição, as medidas de 
dispersão e as medidas de assimetria. Entretanto, temos ainda outra ferra- 


menta: as medidas de curtose. 


A curtose é o grau de achatamento ou de afilamento de uma distribuição 
de frequências, ou seja, do histograma correspondente. É a medida que 
faltava para completarmos o quadro das estatísticas descritivas. A curtose 
indica o quanto uma distribuição de frequências é mais achatada ou mais 


afilada do que uma curva padrão, a qual é denominada de curva normal. 


Por exemplo, se estivermos diante de dados que possuem a mesma média 
e a mesma amplitude total (representamos esses três conjuntos pelas Ta- 
belas 30, 31 e 32). 


Observe que, nos três casos, estamos diante de distribuições simétricas. 


Tabela 30 — Conjunto de dados resultantes de uma pesquisa 


Dados Frequência 


Ha 


oO oo NoU H0 FN oH 
= CQ M N 00 d OU! C 


Nenhuma parte desta publicação poderá ser reproduzida por qualquer meio ou forma sem a prévia autorização da Editora Ibpex. A violação dos direlos autorais é crime estabelecido na Lei nº 9610/1998 e punido pelo art. 184 do Código Penal. 


Tabela 31 — Conjunto de dados resultantes de uma pesquisa 


Dados Frequéncia 


ND 00 NJ OGRO 
m 
oo 


Tabela 32 — Conjunto de dados resultantes de uma pesquisa 


Dados Frequéncia 


1 


OO < dO 01 H- Q n2 3 
=e 0 A Ul Ui Uc d C 


Quar A DIFERENÇA ENTRE ESSAS TRÊS TABELAS? 


No PRIMEIRO caso (Tabela 30), os dados estão uniformemente distribuídos; 
no SEGUNDO CAs0 (Tabela 31), os dados concentram-se em torno da média; 
no TERCEIRO CASO (Tabela 32), os dados têm aproximadamente a mesma 
frequência. Como ficariam as curvas correspondentes (histogramas) às Ta- 


belas 30, 31 e 32, respectivamente? 
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Gráfico 8 - Histograma correspondente à Tabela 30 


fA 
9 


alin. 
1 2 3 4 5 6 7 8 9 


Gráfico 9 — Histograma correspondente à Tabela 31 


fA 


15 


13 


11 


h. 
1 2 3 4 5 6 7 8 9 
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Gráfico 10 — Histograma correspondente à Tabela 32 


fA 


1 
L y E i... 
1 2 3 4 5 6 7 8 9 


Note que a distribuição do Gráfico 8 é normal, enquanto a distribuição do 


Gráfico 9 é alongada e a do Gráfico 10 é achatada. 
À distribuição normal damos o nome de curva mesocúrtica. 
À distribuição alongada damos o nome de curva leptocúrtica. 


À distribuição achatada damos o nome de curva platicúrtica. 


Para a determinação da curtose, sem a necessidade de fazer o gráfico, exis- 
tem fórmulas que nos permitem efetuar o cálculo com maior ou com menor 

precisão. A mais simples, que nos dá o valor aproximado do coeficiente 

percentílico de curtose, é a seguinte: 


MEM M E 
2 (Poo = Pio) 
Em que: 


K = coeficiente percentílico de curtose. 
Q, - primeiro quartil. 

Q, - terceiro quartil. 

Pio = décimo percentil. 


Po = nonagésimo percentil. 
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Em que: 


Q= (n/4- Ef )- A 
1 
fo, 
ETE 
3 
fo, 
.. (10/100 -X£,.) A 
Po Li+ f 
P10 
—T (90.n/100 - Zf „) - A 
90 


f 


P 90 


Como INTERPRETAR O RESULTADO OBTIDO PELA UTILIZAÇÃO DESSA FÓRMULA? 
E simples. 


Quando K - 0,268, o achatamento da curva é igual ao da curva normal, ao 
que denominamos distribuição mesocúrtica*. Os dados obtidos na pesquisa, 


nesse caso, estão “normalmente” distribuídos. 


Logo, conclui-se que, quando temos K > 0,263, estamos diante de uma cur- 
va mais achatada, ao que denominamos distribuição platicúrtica. Os dados 
obtidos na pesquisa, nesse caso, estão bem dispersos em relação à média. 
Trata-se, portanto, de um grupo heterogêneo. 


Quando K < 0,263, estamos diante de uma curva mais alongada, que de- 
nominamos leptocúrtica. Os dados obtidos na pesquisa, nesse caso, estão 
concentrados em torno da média. Trata-se de um grupo bem homogêneo. 


Vamos analisar um exemplo resolvido para ajudá-lo(a) a sanar as últimas 
dúvidas. 


TU C Exercício Resolvido 


A Tabela 33 apresenta as faixas salariais, em número de salários míni- 
mos, dos funcionários de determinada empresa de importação e ex- 


portação na cidade de Alegrete. 
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Tabela 33 — Salários dos funcionários de uma empresa 


Salários Frequéncia (f) 
02 1— — 04 3 
04 1 — — 06 6 
06 — 08 12 
08 — 10 
101——3412 


Nesse caso, vamos determinar: 

a) o primeiro coeficiente de assimetria de Pearson; 
b) o coeficiente percentílico de curtose; 

C) o tipo de curva de frequéncias. 

Vamos, então, à solução do exemplo proposto. 


a) O PRIMEIRO COEFICIENTE DE ASSIMETRIA DE PEARSON É: 


X- Mo 
As- 
S 
— 3:3+5:6+7-.12+9.6+11-3 
30 
— 210 
X= —— 
0 
X=7 
ZT: post ` 
Mo = Li+ pou 
ani post 
6-2 
Mo=6+ 
6+6 
Mo=7 


Observe que tanto a média quanto a moda valem 7. Logo As = 0, qualquer 
que seja S, o que corresponde a uma distribuição de frequências simétricas. 
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b) O COEFICIENTE PERCENTÍLICO DE CURTOSE É: 


|J $-Q, 
2 (Poo E Pro) 


Para o cálculo de Q, precisamos saber em que classe se encontra o elemento 
de ordem n/4. No caso, n/4=30/4= 7,5. Logo, Q, encontra-se na segunda classe 
(intervalo de 4 a 6), pois na primeira e na segunda classes, juntas, temos 


nove elementos. 


7,5-3)-2 
led UE 
6 
Q,=4+1,5 
Q,=55 


Para o cálculo de Q, precisamos saber em que classe encontra-se o elemento 
de ordem 3.n/4. No caso, 3.n/4 = 90/4 = 22,5. Logo, Q, encontra-se na quarta 
classe (intervalo de 8 a 10). 


(22,5 - Piada 
Q,= 

6 
Q,=8+0,5 
Q,-85 


Para o cálculo de p,,, precisamos saber em que classe encontra-se o elemento 
de ordem 10.n/100. No caso, 10.n/100 = 10.30/100 = 3. Logo, p,, encontra-se 


na primeira classe (intervalo de 2 a 4). 


(3-0)-2 
+ 


Pio 


Po=4 


Finalmente, para o cálculo de p,, precisamos saber em que classe encontra- 
se o elemento de ordem 90.n/100. No caso, 90.n/100 = 90.30/100 = 27. Logo, p, 
encontra-se na quarta classe (intervalo de 8 a 10). 


2/-21):2 
6. 07-20 


Po = 


rais é crime estabelecido na Lei nº 9.610/1998 e punido pelo art. 184 do Código Penal. 
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Po = 10 


AGORA, PODEMOS CALCULAR O VALOR DE K. 


= Q, E Q, 
2 (Ps, m Pio) 
z 85-55 
2-(10-4) 
K=— 
12 
K=0,25 


C) EM FUNÇÃO DO RESULTADO OBTIDO NO ITEM ANTERIOR, K = 0,25, VERIFICAMOS 


QUE A CURVA É LEVEMENTE LEPTOCÜRTICA (K < 0,263). 


71 Sintese 


Para realizar uma análise criteriosa de dados, você deve recorrer a várias 
ferramentas, entre elas as estudadas neste capítulo. Como vimos, as me- 
didas de assimetria, ou de enviesamento, são fundamentais na estatística, 
pois indicam o grau de deformação de uma curva de frequências. Na distri- 
buição de frequências ocorre, de acordo com a direção (esquerda ou direi- 
ta) da deformidade, ou desvio da curva, a denominada assimétrica negativa 
ou assimétrica positiva. Temos, portanto, a distribuição simétrica (quando a 
média, a mediana e a moda são iguais, sendo que os quartis Q, e Q} ficam 
equidistantes da mediana), a assimétrica negativa (com desvio à esquerda) 


e a assimétrica positiva (com desvio à direita). Mas como medimos o grau 
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de assimetria? Como você pôde observar nos exercícios resolvidos, utiliza- 


mos nessa tarefa fórmulas como: a do segundo coeficiente de Karl Pearson 
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e também a do coeficiente quartil de assimetria. 


No entanto, nesse processo de medidas não ficamos apenas com as de assi- 
metria. Utilizamos também as medidas de posição, as medidas de disper- 
são e as de curtose. Esta última, a de curtose, é útil para medir o grau de 
achatamento ou de afilamento de uma distribuição de frequências. 
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At Questões para revisão 


1. Em uma distribuição de frequências, verificamos que a moda é igual 
a 8,0, a média é igual a 7,8 e o desvio padrão é igual a 1,0. Determine 
o coeficiente de assimetria de Pearson e assinale a resposta correta na 


relação abaixo. 
( ) 0,20 ()20 ( ) 0,50 
( ) - 0,20 ()-20 
2. Em uma distribuição de frequências, verificou-se que a mediana é 
igual a 15,4, a média é igual a 16,0 e o desvio padrão é igual a 6,0. 


Determine o coeficiente de assimetria de Pearson e assinale a resposta 


correta na relação abaixo. 


rais é crime estabelecido na Lei nº 9.610/1998 e punido pelo art. 184 do Código Penal. 


() 0,10 () 0,30 () 0,50 


GET ( )- 0,30 


3. Observamos que, em uma distribuição de frequências, o primeiro 
quartil é igual a 3, o terceiro quartil é igual 8, o décimo centil é igual 
a 1,5 e o nonagésimo centil é igual a 9. Com base nesses resultados, 
podemos afirmar que se trata de uma curva: 


( ) mesocürtica, com k = 0,263; 
( ) leptocürtica, com k - 0,233; 
( ) leptocürtica, com k = 0,25; 


( ) platicürtica, com k = 0,45; 
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( ) platicúrtica, com k = 0,333. 
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4. O coeficiente de curtose (K) para uma determinada distribuição de 
frequências é igual a 0,297. Podemos, então, afirmar que a curva é: 


( ) mesocúrtica; 
( ) platicürtica; 
( ) leptocúrtica; 
( ) assimétrica positiva; 
( ) simétrica. 
5. O segundo coeficiente de assimetria de Pearson, para determinada 


distribuição de frequências, é igual a zero. Podemos, então, afirmar 


que a curva é: 
( ) mesocúrtica; 
( ) leptocúrtica; 
( ) platicürtica; 
( ) simétrica; 


( ) assimétrica positiva. 


6. Descreva o que indicam as medidas de assimetria. 


7. O que indicam as medidas de curtose? 
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Cálculo de probabilidades 


Conteúdos do capítulo 


e Definições e conceitos básicos da teoria das probabilidades 

e Cálculos de probabilidade 

e Aplicação da regra de adição, da de multiplicação e do teorema de 
Bayes em estatística 


Após o estudo deste capítulo, você será capaz de: 


E 


conceituar a teoria das probabilidades; 

aplicar em casos práticos os conceitos teóricos; 

3. aplicar a regra da adição, a da multiplicação e o teorema de Bayes em 
casos de cálculos da probabilidade. 


I 


Teoria das probabilidades: conceitos básicos 


PROBABILIDADE, NUM CONCEITO AMPLO, É O ESTUDO DOS FENÓMENOS ALEATÓRIOS. 


Os fenômenos estudados em estatística são fenómenos cujo resultado, 
mesmo em condições normais de experimentação, variam de uma obser- 
vação para outra, dificultando dessa maneira a previsão de um resultado 
futuro. Para a explicação desses fenômenos, chamados de aleatórios, adota- 
se o modelo matemático denominado teoria das probabilidades. 


Historicamente, a teoria da probabilidade começou com o estudo dos jogos 


de azar, como a roleta e as cartas!. Hoje, suas aplicações são inúmeras. 


Para entender a inferência estatística, é preciso entender vários conceitos de 
probabilidade. A probabilidade e a estatística estão estreitamente relaciona- 
das, porque formulam tipos opostos de questões. NA PROBABILIDADE, sabemos 
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como um processo ou experimento funciona e queremos predizer quais serão 


os resultados de tal processo. Em ESTATÍSTICA, nào sabemos como um processo 
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funciona, mas podemos observar os seus resultados e utilizar as informações 


sobre os mesmos para conhecer a natureza do processo ou do experimento. 


O termo probabilidade é usado de modo muito amplo na conversação diária 
para sugerir um certo grau de incerteza sobre o que ocorreu no passado, o 


que ocorrerá no futuro e o que está ocorrendo no presente. 


O torcedor de certo time pode apostar contra ele porque sua probabilidade 
de ganhar é pequena. O serviço de meteorologia pode prever tempo ruim 
porque a probabilidade de chuvas é grande. 


É também importante o cálculo das probabilidades em situações que envol- 
vam tomada de decisào. Um empresário, por exemplo, precisa de informa- 
ções sobre a probabilidade de sucesso para a exportação de determinado 
produto em um determinado mercado. 


Logo, os modelos probabilísticos podem ser üteis em diversas áreas do 
conhecimento humano, tais como em administração de empresas, ciências 


econômicas ou comércio exterior. 


ExPERIMENTO ALEATÓRIO E é aquele que poderá ser repetido sob as mesmas 
condições indefinidamente. Tal experimento apresenta variações de resul- 
tados, não sendo possível afirmar a priori qual será sua determinação antes 
que o mesmo tenha sido realizado. É possível, porém, descrever a probabi- 
lidade de cada possível resultado, bem como é possível relacionar todos os 
resultados que podem ocorrer. O lançamento de uma moeda é um experi- 
mento aleatório, pois esse experimento poderá ser repetido quantas vezes 
desejarmos. Antes do lançamento, não poderemos dizer qual será o resultado, 


mas somos capazes de relatar os possíveis resultados: cara ou coroa. 


Assim, a estatística baseia-se em experimentos enquanto o cálculo de pro- 
babilidades baseia-se em postulados lógicos. O cálculo das probabilidades 
e a estatística estão relacionados por intermédio da chamada Lei dos Grandes 
Números?, que será estudada adiante. 


Espaço amostral 


Definimos espaço amostral S como sendo o conjunto de todos os possíveis 


resultados de um experimento E. 


Por exemplo, no experimento que consiste no lançamento de um dado, o 


espaço amostral é S = (1, 2, 3, 4, 5, 6). 
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Evento 


Evento é qualquer conjunto de resultados de um experimento. Sendo o 
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evento um subconjunto de S, indicaremos os eventos por letras maiúsculas: 


A, B, C, e assim por diante. 


Por exemplo, no experimento que consiste no lançamento de um dado, pode- 


mos definir o evento A como “sair um número par”. 
Então, A = {sair número par}. 
A- (2, 4, 6). 


111 


112 


Evento Simples 
É aquele formado por um único elemento do espaço amostral. 


Por exemplo, no experimento que consiste no lançamento de um dado, o even- 


to A, definido como “sair um número maior que 5”, é um evento simples. 


A=(6). 


Evento composto 


É aquele que possui mais de um elemento. Note que o evento A = (2, 4, 6) é 
composto. 


Evento certo e evento impossível 


Diante das explicações sobre eventos, notamos que S (espaço amostral) e Ø 
(conjunto vazio) também são eventos, chamados respectivamente de evento 


certo e evento impossível. 


Definição de probabilidade 


A fim de entendermos probabilidade, vamos utilizar processos aleatórios 


familiares, tais como: 
a) jogar uma moeda vinte vezes e observar o número de caras obtidas; 


b) retirar uma carta de um baralho comum de 52 cartas e observar seu 
naipe; 
c) jogar um dado dez vezes e observar quantas vezes a face que con- 


tém o 6 é voltada para cima. 


O conhecimento de como se aplicam os princípios da probabilidade às si- 
tuações em que sabemos o modo como o processo funciona vai nos ajudar 
a compreender de que maneira podemos usar a inferência estatística para 


conhecer a natureza de um processo desconhecido. 
A análise dos três processos anteriormente exemplificados revela-nos que: 


a) cada experimento poderá ser repetido indefinidamente sob as mesmas 
condições; 


b) não conhecemos, a princípio, um resultado particular do experimento, 
mas sabemos todos os possíveis resultados; 


rt. 184 do Código Penal 


c) quando o experimento é repetido um grande número de vezes, surge 
uma regularidade, ou seja, podemos observar uma tendéncia. Essa re- 
gularidade é observada pela estabilidade da fração fr = f/n (frequência 
relativa), em que f é o número de sucessos de um resultado particular 
estabelecido antes do experimento e n é o número de repetições. 


Suponhamos, agora, duas outras situações. Na primeira, extraímos aleato- 
riamente 10 (dez) bolas de uma caixa que contém 20 (vinte) bolas pretas e 
80 (oitenta) bolas vermelhas. Pela teoria das probabilidades, podemos de- 
terminar que existe a probabilidade de exatamente oito dessas bolas serem 
vermelhas e as outras duas serem pretas. A probabilidade é dada por um 
valor numérico entre 0 e 1. No exemplo dado, obter oito bolas vermelhas 
e duas pretas é o que chamamos de esperança matemática, ou seja, o resul- 
tado com maior probabilidade de ocorrer. Na segunda, antes de uma elei- 
ção presidencial, perguntamos a 2.000 pessoas escolhidas aleatoriamente 
o nome do seu candidato e, utilizando a inferência estatística, é possível 
prever as tendências presidenciais da população, tendo como base os re- 
sultados obtidos na amostra. 


A probabilidade matemática de um acontecimento é a relação entre o número 
de casos favoráveis e o número de casos possíveis, desde que haja rigorosa 
equipossibilidade entre todos os casos. 


Designando por S o número de casos possíveis e por A o número de casos 
favoráveis, temos a probabilidade P assim definida: 


P(A) = : 
S 
Ou seja: 


nümero de elementos do evento A 


P(A)= — 
número de elementos do espaço amostral S 


O valor de P(A) é sempre uma fração compreendida entre zero e um, pois 
o número de casos favoráveis nunca pode ser maior que o número de casos 


possíveis. 
Os valores limites da probabilidade são: 


a) P(A) = 0 quando A = 0, isto é, não há casos favoráveis; há certeza de 


não acontecer; 
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b) P(A)=1 quando A - S, isto é, todos os casos são favoráveis, havendo 


certeza do acontecimento. 


A probabilidade do nào acontecimento costuma ser simbolizada pela letra 
Q, em que Q(A) 2 1 - P(A). 


Logo: P(A) * Q(A) -1 


Lei dos grandes números 


Conforme DuPasquier, citado por Farias, Soares e Cesar”, em uma série de 
observações de um conjunto natural, realizadas todas em circunstâncias 
idénticas, um atributo "x" ocorre com uma frequéncia relativa, cujo valor é 
uma aproximação da probabilidade, aproximação essa tanto maior quanto 


maior for o número de observações. 


Por exemplo, qual a probabilidade de obtermos uma cara em uma única 


jogada de uma moeda honesta? 


rais é crime estabelecido na Lei nº 9610/1998 e punido pelo art. 184 do Código Penal. 


S = (cara, coroa} 


A= {deu cara) 
P(A) = 1/2 ou 50% 


Ou, então, qual a probabilidade de obtermos uma única cara em um lan- 
çamento de três moedas? 


Considerando K = cara, C = coroa e sendo A = (deu uma única cara}, temos: 
S - (KCC, KKC, KKK, CKC, CKK, CCK, CCC, KCK} 
Então, P(A) = 3/8. 


Ainda qual a probabilidade de obtermos como resultado o 5 em uma única 
jogada de um dado honesto? 
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A- (deu 5] 
5-(1,2,3,4,5,6] 


PLAT - 1/6 
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Curiosidade: na estatística, uma ferramenta honesta é aquela que nào 
é viciada. Por exemplo, um dado honesto significa um dado que nào é 
viciado. Em outras palavras, é um dado em que qualquer resultado tem 


a mesma probabilidade de ocorrer, para qualquer face. 


TU Exercícios Resolvidos 


1. Quala probabilidade de obtermos o total de seis (6) pontos na jogada 
de dois (2) dados honestos? 


S = [36 resultados possíveis) 

A = (a soma dos dois dados é igual a 6) 
A-10,5) Q,4) (3,3, (4, 2, (5,1) 
P(A) = 5/36 


2. Qual a probabilidade de sair uma figura (valete, dama ou rei) na reti- 
rada de uma única carta de um baralho comum de 52 cartas? 


S = [52 resultados possíveis!) 

A= (a carta retirada é uma figura) 

P(A) = 12/52 = 3/18 

Obs.: lembrar que temos quatro valetes, quatro damas e quatro reis. 


3. Qual a probabilidade de acertarmos o resultado do sorteio da mega- 


sena com um único cartão jogado de seis dezenas? 
O número de resultados possíveis, S, é igual a C... 


N! 
Como C, xs 


— — — | temos que 
*  XI(N-X)! 


E 60! 
$$ 6 (60— 6) 


Ca = 50.063.860 


Seja A = [acertar as 6 dezenas sorteadas) 
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P(A) = 0,000.000.019 ou 0,000.001.9%. 


~ 50.063.860 


Esperanca matemática 


Aos valores que em estatística denominamos de médias, no cálculo das pro- 


babilidades denominamos de esperanças matemáticas. 
O cálculo da esperança é possível pela fórmula: 
E(x)=n-p 

Em que: 


E(x) = esperança matemática de ocorrer o evento x; 
n = número de tentativas; 
p = probabilidade de sucesso, ou seja, probabilidade de ocorrer o 


evento x em uma tentativa única. 


Originalmente, o conceito de esperança matemática surgiu em função de 
sua relação com jogos de azar e, em sua forma mais simples, é o produto da 
quantia que um jogador pode ganhar (o prêmio) pela probabilidade de que 
isso ocorra. 


Assim, se em uma caixa encontram-se 100 canetas, sendo 20 pretas, 50 ver- 
melhas e 30 azuis, qual o valor esperado de canetas azuis, em 20 retiradas 


de uma caneta, se houve a reposição da mesma na caixa? 


30 
P 100 
E(69)=n-p 
30 
E(x) 20: —— 
100 
E(x)= 6 


Ou SEJA, ESPERAMOS QUE, NAS VINTE TENTATIVAS, SEIS CANETAS SEJAM AZUIS. 
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TU + Exercício Resolvido 


Qual a esperança matemática de uma pessoa que joga na aposta 
mínima da mega-sena, cujo prêmio previsto para o ganhador é de 
R$ 1.000.000,00? 


Já vimos, no exemplo 6, que o número de resultados possíveis é de 50.063.860, 


e a probabilidade de ganhar o prêmio é de — — — — 
50.063.860 


A esperança matemática é: 
E(x)2n.p 

E(x) = 1.000.000 . —————— — 
50.063.860 

E(x) = 0,02 


O que esse resultado nos mostra? Mostra que só devemos pagar R$ 0,02 por 
aposta, um valor muito inferior ao que é cobrado da pessoa que pretende 


“tentar a sorte”. 


Probabilidades finitas dos espaços amostrais finitos 


Seja S um espaço amostral finito, em que S = (a, a, ..., a ). Considere o 
evento formado por um resultado simples: A = (a). 


A cada evento simples (a), associa-se um número P, denominado de proba- 


bilidade de (a } ocorrer, satisfazendo as seguintes condições: 
a) P,20,sendoi- 1,2, ..., n; 
bDP+P,+..+P -1. 


A probabilidade P(A) de cada evento composto (mais de um elemento) é 
entào definida pela soma das probabilidades dos pontos de A. 


Portanto, se trés cavalos — A, B e C - estão em uma corrida, e o cavalo A tem 
duas vezes mais probabilidade de ganhar que o B e o cavalo B tem duas 
vezes mais probabilidade de ganhar que o C, quais sáo as probabilidades 
de vitória de cada cavalo, isto é, P(A), P(B) e P(C)? 


Faça P(C) = p; então, P(B) = 2.p e P(A) = 4.p. Como a soma das probabilida- 
des é igual a 1, temos: 


p*2p-*4p-71 ou 7.p=1 ou p- 1/7. 
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Entào: 


P(A) - 4/7 
P(B) = 2/7 
P(C) - 1/7 


Espacos amostrais finitos equiprováveis 


Quando associamos a cada ponto amostral a mesma probabilidade de 
ocorrência, o espaço amostral é dito equiprovável ou uniforme. 


Em particular, se S contém n pontos, então a probabilidade de cada ponto 
é 1/n. 


Logo, se você escolher aleatoriamente (a expressão aleatória nos indica que 
o espaço é equiprovável) uma carta de um baralho comum com 52 cartas, 
em que seja A = (a carta é de ouros) e B = (a carta é uma figura], deve cal- 
cular P(A) e P(B). 


número de ouros IS 1 
P(A) = = = 
total de cartas 52: 4 


nümero de figuras 12 3 
P(B) = = 3 
total de cartas 52 13 


Acontecimentos mutuamente exclusivos 


Dois acontecimentos podem ser mutuamente exclusivos, isto é, ocorrendo 
um deles nào pode ocorrer o outro. Por exemplo, se ao lancarmos um dado 


aparecer o nümero 4, entào nào pode ter aparecido o nümero 5. 


Regra da adição para eventos mutuamente exclusivos 


Quando A e B são eventos mutuamente exclusivos, P(AUB) = P(A) + P(B). 
Como NÓS LEMOS ESSA IGUALDADE? 


Lemos: a probabilidade de acontecer o evento A ou o evento B é igual à 
probabilidade de acontecer o evento A mais a probabilidade de acontecer 
o evento B. 


Nenhuma parte desta publicação poderá ser reproduzida por qualquer meio ou forma sem a prévia autorização da Editora Ibpex. A violação dos direlos autorais é crime estabelecido na Lei nº 9610/1998 e punido pelo art. 184 do Código Penal. 


O símbolo u corresponde, na teoria dos conjuntos, à uniào e, na aritmética, à 


soma. Corresponde, ainda, na álgebra boolena, à disjunção "OU". 


Vamos verificar, no exemplo do cálculo de "esperança matemática”, na pá- 


gina 106, qual seria a probabilidade de B ou C ganhar? 
P(BUC) = P(B) + P(C) = 2/7 + 1/7 = 3/7. 


Ov, ENTÃO, QUAL A PROBABILIDADE DE TIRARMOS O PRIMEIRO PRÊMIO EM UM 


SORTEIO DE 100 BILHETES, ESTANDO-SE DE POSSE DE TRÊS DESSES BILHETES? 


A probabilidade de cada bilhete é de 1/100. Logo, aplicando a regra da adi- 
ção, a probabilidade de ganharmos é: P = 1/100 + 1/100 + 1/100 = 3/100. 


Eventos não mutuamente exclusivos 


Consideremos o caso de dois eventos que podem ocorrer simultaneamente. 
Suponhamos A = [extração de um ás de um baralho) e B = {extração de uma 
carta de espadas}. 


Então, A e B não são mutuamente exclusivos, visto que pode ser extraído 
o ás de espadas. 


Somando simplesmente P(A) + P(B), estamos contando duas vezes os 
resultados de (A^5B). Por conseguinte, para obter o número correto de re- 
sultados P(AUB), devemos subtrair P(ANB). 


O símbolo N corresponde, na teoria dos conjuntos, à interseção e, na aritmética, 
à multiplicação. Corresponde, ainda, na álgebra booleana, à conjunção “E”. 


Regra da adição para eventos não mutuamente exclusivos 


Quando A e B são eventos não mutuamente exclusivos, 


P(AUB) = P(A) + P(B) - P(ACB), em que 


Nenhuma parte desta publicação poderá ser reproduzida por qualquer meio ou forma sem a prévia autorização da Editora Ibpex. A violação dos direitos autorais é crime estabelecido na Lei nº 9610/1998 e punido pelo art. 184 do Código Penal. 


P(ANB) = P(A) - P(B) 


A fórmula P(AUB) = P(A) + P(B) - P(AnB) é a regra geral de adição, sejam 
os eventos mutuamente exclusivos ou não. Por quê? Porque, no caso dos 
eventos serem mutuamente exclusivos, P(ANB) = 0. 


Devemos estar atentos para o fato de que P(ANB) = P(A) - P(B), quando os 
eventos A e B são independentes. 
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Quando um evento A é independente de um evento B, o evento B também 
é independente do evento A. 


Por exemplo, ao jogarmos uma moeda, se definirmos o evento A como "deu 
cara" e o evento B como "deu coroa”, é fácil observar que se "deu cara" nào 
pode ter "dado coroa" e vice-versa. 


Logo, dois eventos são independentes quando a ocorrência de um deles 
não depende da ocorrência do outro. 


Há eventos, entretanto, que são dependentes. 


Por exemplo, em um carregamento de mil sacas de café, 140 delas estão 
com peso abaixo do recomendado. Se uma pessoa escolher ao acaso duas 
sacas desse carregamento, qual é a probabilidade das duas estarem abaixo 
do peso? 


Nesse caso, ao retirarmos a segunda saca, devemos levar em conta que a 
primeira já havia sido retirada. Logo, para o cálculo da probabilidade pro- 
curada, esse fato deve ser levado em consideração. Você aprenderá a fazer 
esse cálculo logo adiante, ao estudar probabilidade condicional. 


TU Exercícios Resolvidos 


1. Aose retirar uma carta de um baralho comum de 52 cartas, qual a pro- 
babilidade de ela ser ou um ás ou uma carta de espadas? 


No presente caso, P(A) = 4/52, P(B) = 13/52 e P(A^B) = 4/52 x 13/52 = 1/52. 
Então, P(AUB) = 4/52 + 13/52 - 1/52 = 16 / 52 = 4/13. 


2. Jogamos um dado branco e um dado preto. CALCULE A PROBABILIDADE 


DE OCORRER: 
a) soma igual a 5; 
b) soma iguala 11. 


Sabemos que, ao jogar dois dados, existem 36 diferentes resultados (os seis 
(6) do primeiro dado, vezes os seis (6) do segundo dado). Então: 


S=1(1, 1), (1,2) (1,3), (1, 4), (1,5), (1, 6), (2, 1), (2, 2), (2, 3), (2, 4), (2, 5), (2, 6), 
(3, 1), (3, 2), (8, 3), (3, 4), (3, 5), (3, 6), (4, 1), (4, 2), (4, 3), (4, 4), (4, 5), (4, 6), (5, D), 
(5, 2), (3, 3), (5, 4), (5, 5), (5, 6), (6, 1), (6, 2), (6, 3), (6, 4), (6, 5), (6, 6)] 
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a) A soma igual a 5 pode ocorrer nos seguintes casos: 
A - ((, 4), (2, 3), (3, 2), (4, 1)) 
Sabemos, pela definição de probabilidade, que: 


nümero de elementos do evento A 


P(A)= — 
número de elementos do espaço amostral S 


Então, temos: 
4 
P(A) = EU —- 0,1111 ou 11,11% 


b) A soma igual a 11 pode ocorrer nos seguintes casos: 
B = {(5, 6), (6, 5)] 
Agora, temos: 
2 
P(B) » — = 0,0556 ou 5,56% 
36 
3. Quando uma carta é retirada de um baralho comum de 52 cartas, QUAL 
A PROBABILIDADE (CALCULE) DE: 
a) sair uma carta vermelha; 
b) sair uma carta de copas; 
c) sair um valete. 
Sabendo que um baralho comum tem 52 cartas, assim distribuídas: 
e naipe de copas: 13 cartas — estas são cartas vermelhas; 
e naipe de ouros: 13 cartas — estas são cartas vermelhas; 
e naipe de paus: 13 cartas — estas são cartas pretas; 
e naipe de espadas: 13 cartas — estas são cartas pretas. 


a) Ao retirarmos desse baralho uma única carta, a probabilidade de ela 


ser uma carta vermelha é: 


A = (carta é vermelha) 
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26 
P(A) = — - 0,5 ou 50% 
52 
b) Aoretirarmos desse baralho uma ünica carta, a probabilidade de ela 
ser uma carta de copas é: 


B - (carta é de copas] 
13 
P(B) = — = 0,25 ou 25% 
52 
C) Aoretirarmos desse baralho uma ünica carta, a probabilidade de ela 


ser um valete é: 


C = (carta é um valete] 
4 
P(C) = E 0,0769 ou 7,6996 


4. Em uma disputa final de torneio de tiro ao alvo, a probabilidade de 
Kendric acertar no alvo é de 1/2 e a de Marcel atingir o mesmo alvo é 
de 3/5. Qual a probabilidade do alvo ser atingido, se ambos atirarem 
nele? 


Estamos diante de dois eventos NÃo mutuamente exclusivos, ou seja, se 


Kendric acertar o alvo, não exclui a possibilidade de Marcel também o acertar. 


Logo, se definirmos que: 

A = (Kendric acertou o alvo] e 
B = (Marcel acertou o alvo), 
temos que: 

P(AUB) = P(A) + P(B) - P(ANB) 
Em que: 

P(ANB) = P(A) - P(B) 


Ou seja: 


1 3 
P(AUB)- += 
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1 3 3 
P(AUB)=— + >- —— 
2 5 10 


8 
P(AUB) = = 70,80 ou 80% 


Acontecimentos simultâneos e sucessivos 


Há acontecimentos independentes que podem ser simultâneos, como o caso 
de um baralho em que queremos tirar uma carta de espadas e uma carta que 


seja uma figura. A isso damos o nome de ACONTECIMENTO COMPOSTO. 


Há, no entanto, acontecimentos independentes sucessivos. São os que exigem 
a ocorrência do primeiro fato para que possa existir a hipótese do segundo 
acontecimento, tal como neste exemplo: em duas jogadas sucessivas de um 
dado, qual a probabilidade que temos de sair o número 5 as duas vezes? A 


isso damos o nome de ACONTECIMENTO COMPLEXO. 


Probabilidade condicional 


Dados dois eventos, A e B, de um espaço amostral S, denota-se por P(A | B)a 
probabilidade condicionada de ocorrer o evento A quando o evento B já tiver 


ocorrido, assim: 


P(ANB 
P(A|B)- Lal) com P(B) z 0, pois B já ocorreu. 
P(B) P J 


Então, para avaliar a probabilidade de ocorrer A, dado que B já ocorreu, 
basta contar o número de casos favoráveis do evento (A^B) e dividir esse 


nümero pela quantidade de casos favoráveis do evento B. 


Quando os eventos A e B são independentes, temos P(A|B) = P(A) ou 
P(BlA) = P(B). 


Vamos analisar alguns exemplos para que você possa entender melhor o 


que foi dito. 


Caso seja E o experimento que consiste em lançar um dado, e o evento 
A= {saiu o número 2}, então, P(A) = 1/6. 


Considere agora o evento B = {saiu um número par}. 


Então, P(B) = 3/6 = 1/2. 
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Nesse exemplo, podemos estar interessados em avaliar a probabilidade 
de que ocorra o evento À (saiu o nümero 2), condicionada à ocorréncia do 


evento B (saiu um nümero par). Em símbolos, designa-se por P(A | B). 
Observe que, dada a informação da ocorrência do evento B, reduzimos o 
espaço amostral S de (1, 2,3, 4, 5, 6} para (2, 4, 6). Logo P(A | B) = 1/3. 


Ou, se for o caso de um nümero ser sorteado ao acaso entre os inteiros de 
1a 15. Se o nümero sorteado for par, QUAL A PROBABILIDADE DE QUE SEJA O 


NÜMERO 6? 

S - (1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15) 
Chamemos A - (o nümero é 6], 

e B = {o número é par}. 

Então, P(A|B) - ? 


Note que a probabilidade de ocorrência do evento A, sem a informação da 


ocorréncia do evento B, é: 
P(A) = 1/15 


Dada, porém, a informação de que o número sorteado foi par, o espaço 
amostral reduz-se para {2, 4, 6, 8, 10, 12, 14} e é nesse espaço amostral que 


iremos avaliar a probabilidade de ocorrer o evento A. 


P(A | B) número de casos favoráveis do evento A ^ B 1 
nümero de casos favoráveis do evento B 7 


Pois (ANB) = { 6 } e B = {2, 4, 6, 8, 10, 12, 14). 


E, em uma situação em que se retira, sem reposição, duas peças de um lote 
de dez peças, em que apenas quatro são boas, QUAL A PROBABILIDADE DE QUE 


AMBAS SEJAM DEFEITUOSAS? 
A= [a primeira peça é defeituosa) 
B = {a segunda peça é defeituosa} 
P(A^B) = P(A) - P(B | A) 
P(ANB) = 6/10 - 5/9 - 1/3 


Observe que P(A | B)éa probabilidade da segunda peça ser defeituosa, 
dado que a primeira era defeituosa. 


lora Ibpex. A violação dos dire 


Observe que, em experimentos em que ocorre reposição, o elemento 
escolhido é devolvido à população, podendo ser escolhido novamente. 
Se não houver reposição, o elemento, uma vez escolhido, não é devolvido 


à população, não podendo, assim, ser escolhido novamente. 


Regra da multiplicação 


A partir do que vimos na probabilidade condicional, tanto no acontecimento 
composto como no acontecimento complexo, aplica-se a regra da multipli- 


cação, que diz: 


A probabilidade de um acontecimento complexo ou composto é igual ao 
produto das probabilidades simples dos acontecimentos considerados 


(quando os acontecimentos anteriores já se realizaram). 
Ou seja: 
P(ANB) = P(B) - P(A | B) ou P(ANB)=P(A) - P(B | A) 
Quando os eventos A e B são independentes, temos que a P(ANB) = P(A) - P(B) 


O princípio da multiplicação afirma que, se o primeiro de dois experimen- 


DO 


tos admite "a" resultados possíveis e o segundo comporta "b" resultados 
possíveis, podendo ocorrer qualquer combinação desses resultados, então 
o número total de resultados possíveis dos dois experimentos é a -b 


Vamos ver como isso funciona. 


Suponhamos que temos cinco candidatos de direita para disputar as eleições 
à presidência, e seis candidatos de esquerda disputando as mesmas eleições. 
QUAL O NÚMERO DE PARES POSSÍVEIS DE CANDIDATOS NA ELEIÇÃO GERAL, SENDO UM 


DE DIREITA E OUTRO DE ESQUERDA? 
Número de candidatos = 6 -5=30 


AGORA, EM TRÉS JOGADAS DE UM DADO, QUAL A PROBABILIDADE DE SAIR TRÉS 


VEZES SEGUIDAS O NÜMERO 2? 

Na primeira jogada, a probabilidade é de 1/6. 

Na segunda jogada, a probabilidade é de 1/6. 

Na terceira jogada, a probabilidade é de 1/6. 

Então, a probabilidade procurada é, pela regra da multiplicação, igual a: 


P =1/6 - 1/6 - 1/6 = 1/216 
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Vamos transformar esse resultado em porcentagem: 


1 
— — = 0,00463, ou seja, 0,463% 
216 


TU Exercícios Resolvidos 


1. Em uma caixa, temos três bolas brancas, duas bolas pretas e cinco bolas 
amarelas. QUAL A PROBABILIDADE DE RETIRARMOS DUAS BOLAS BRANCAS, 


UMA APÓS A OUTRA, SEM REPOSIÇÃO? 
A = [a primeira bola é branca) 
B = (a segunda bola é branca) 
P(ANB)=P(A)- P(B | A) 


P(ANB) = 3/10 - 2/9= 1/15 


Vamos transformar esse resultado em porcentagem: 
1 
E = 0,0667, ou sEJA, 6,67% 


2. Numlote de doze peças, quatro são defeituosas. Nesse caso, considerando 
que três peças são retiradas aleatoriamente, uma após a outra, sem repo- 
Sição, ENCONTRE A PROBABILIDADE DE TODAS ESSAS PEÇAS RETIRADAS SEREM 
NÃO DEFEITUOSAS. 


A probabilidade de a primeira peça ser não defeituosa é 8/12, já que oito 
das doze peças são não defeituosas. Se a primeira peça é não defeituo- 
sa, então a probabilidade de a próxima ser não defeituosa é 7/11, pois so- 
mente sete das onze peças restantes são não defeituosas. Finalmente, se a 


segunda peça também é não defeituosa, a probabilidade de a terceira ser 
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não defeituosa é 6/10, já que somente seis das dez peças restantes são não 
defeituosas. Então: 


A= [a primeira peça é não defeituosa) 
B = (a segunda peça é não defeituosa! 
C = (a terceira peça é não defeituosa) 
P(AnNnBnC)=8/12:7/11 - 6/10 = 14/55 
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Independência estatística 

Um evento A é considerado independente de um evento B se a probabilidade 
de A é igual à probabilidade condicional de A, dado B, isto é, se: 
P(A)=P(A | B). 

É evidente que se A é independente de B, e B é independente de A, temos: 

P(B) - P(B | A). 


Considerando-se a regra da multiplicação, podemos afirmar que se Ae B 
são independentes, então: 


P(ANB) = P(A) - P(B). 


Dados n eventos A, A,, ..., Ay dizemos que eles são independentes se o 
forem2a2,3a3,..,nan. 


Então: P(A ^ A, .. 0 A) = P(A)  P(A)) . .... P(A). 
Vamos analisar alguns exemplos. 


No primeiro, vamos considerar duas pessoas identificadas como A e B. Nes- 
se caso, se a probabilidade de que A esteja viva daqui a 20 anos é 70% e a de 
que B esteja viva daqui a 20 anos é de 50%, então A PROBABILIDADE DE QUE 


AMBAS ESTEJAM VIVAS DAQUI A 20 ANOS É DE: 
P(A e B estarem vivas) = 70/100 . 50/100 = 35/100 ou 35% 


Como segundo caso, analisaremos o lançamento de dois dados. Verifique se 
os eventos A e B são independentes, sendo que A é o evento em que a soma 
dos pontos dos dois dados é quatro (4), e B o evento em que no primeiro dado 
deu 1. Lembre-se que, para essa experiência, o espaço amostral tem 6 x 6 = 36 
elementos, dos quais seis correspondem a pares de números em que no pri- 
meiro dado deu 1. 


S=((1, 1), (1,2), (1,3), (1,4), (1, 5), (1, 6), (2, 1), (2, 2), (2, 3), (2, 4), (2,5), (2, 6), 
(3, 1, (3,2), (3, 3), (3, 4), (3,5), (3, €), (4, 1), (4, 2), (4, 3), (4, 4), (4, 5), (4, 6), (5, 1), 
(5, 2), (3, 3), (5, 4), (5, 5), (5, 6), (6, 1), (6, 2), (6, 3), (6, 4), (6, 5), (6, 6)] 


Logo, P(B) = 6/36 = 1/6 


Os elementos do espaço amostral que indicam soma igual a quatro (4) são: 
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(1, 3), Q, 2) e (3, 1). 
Logo, P(A) = 3/36 = 1/12. 


Então, a probabilidade de a soma ter sido quatro (4), se sabemos que no 


primeiro dado deu o número 1, é: 
P(A | B)=1/3 


Evidentemente, A e B nào são independentes, pois P(A) é diferente de P(A | B). 


fL. iExercícios Resolvidos 


1. Uma urna contém oito bolas brancas, sete bolas pretas e quatro bolas 
verdes. Uma bola é retirada aleatoriamente dessa urna. CALCULE A PRO- 


BABILIDADE DE: 
a) sair uma bola branca; 
b) sair uma bola preta; 
c) sair uma bola verde. 


Vamos calcular inicialmente a probabilidade de a bola ter sido branca. Como 
temos oito bolas brancas de um total de dezenove bolas (8 * 7 * 4), a proba- 
bilidade procurada é: 


8 
P (bola ser branca) = — 
19 


Agora, a probabilidade de a bola ter sido preta. Como temos sete bolas 
pretas de um total de dezenove bolas, a probabilidade procurada é: 


7. 
P (bola ser preta) = — 
( preta) 19 


Finalmente, vamos calcular a probabilidade de a bola ter sido verde. Te- 
mos quatro bolas verdes. Então: 


P (bola ser verde) = ETE 
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2. Um número inteiro é escolhido ao acaso dentre os números de 1 a 30. 


CALCULE A PROBABILIDADE DE: 
a) o número ser divisível por 3; 
b) o número ser divisível por 5; 
c) o número ser divisível por 3 ou por 5; 
d) o número ser divisível por 3 e por 5. 


E necessário agora relembrar que associamos a operação lógica OU à 
operação aritmética + (soma) e associamos a operação lógica E à opera- 


ção aritmética x (multiplicação). 
Vamos, então, à solução do exemplo 27. 


S={1,2,3, 4, 5, 6,7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 
25, 26, 27, 28, 29, 30] 


Chamemos de A = (o número é divisível por 3) 


Então: 


10 1 
P(A) = a al pois temos dez números divisíveis por 3. 


Chamemos de B = (o número é divisível por 5) 


1 
P(A) = — =—, pois temos seis números divisíveis por 5. 
30 5 


Chamemos de C = [o número é divisível por 3 ou por 5) 
Então: 


P (C) = P(A) + P(B) - P(A) - P(B) 


TES 
- + 
(O dede 


1 1 1 
P(C)=— + — — — 

3 5 15 
5+3-1 


P(C) = 15 
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7 
FO ag 


Chamemos de D = [o número é divisível por 3 e por 5) 


Então: 

6 | 1 
(D) = = 
1 

Ejs 


15 


3. Uma urna contém cinco bolas brancas e trés vermelhas, sendo que uma 
outra urna contém quatro bolas brancas e cinco vermelhas. Consideran- 
do que uma bola é retirada de cada urna, ENCONTRE A PROBABILIDADE DE 


SEREM: 


a) da mesma cor; 
b) de cores diferentes. 


Para facilitar a visualização do exercício, vamos representar as duas urnas: 


Urna 1 Urna 2 
5 brancas 4 brancas 
3 vermelhas 5 vermelhas 


Calculemos então a probabilidade de as duas bolas, uma retirada da urna 1 


e outra retirada da urna 2, serem ambas da mesma cor. 
As duas poderão ser brancas. Então: 


4 
P (duas brancas) = — - — 
8 9 


Observe que multiplicamos as probabilidades, porque estamos supondo 
que uma E outras bolas são brancas. Portanto, à operação lógica E, associa- 
mos a multiplicação, lembra-se? 


Mas as duas poderiam ter sido vermelhas. Entào: 


3 5 
P (duas vermelhas) = a : ve 
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Como queremos calcular a probabilidade de as duas serem da mesma cor, 
elas poderão ser ambas brancas OU ambas vermelhas. Logo: 


P (ambas da mesma cor) f 4 
8 9 8 
20 15 

P (ambas da mesma cor) = — + — 
72 72 
35 

P (ambas da mesma cor) = ue 


Nós somamos as duas probabilidades, porque, à operação lógica OU, asso- 


ciamos a operação aritmética soma. 
Vamos agora calcular a probabilidade de as bolas serem de cores diferentes. 


Duas situações podem ocorrer: a primeira bola ser branca e a segunda ser 
vermelha ou a primeira bola ser vermelha e a segunda ser branca. 

P (1º branca e 25 vermelha) = 
P (1º vermelha e 2º branca) = 


Lembre-se de que só ocorre uma dessas duas situações: ou uma ou outra. 
Então: 


5 
P (bolas de cores diferentes) = s 9 + 


P (bolas de cores diferentes) * 
72 72 72 
Vocé pode, ainda, resolver a segunda parte desse exercício da seguinte forma: 


35 
como eu sei que a probabilidade das bolas serem da mesma cor é ru então a 


72 
probabilidade de serem de cores diferentes é o que falta para E ou seja: 


35 37 


P (bolas de cores diferentes) = 1 - — = — 
72 72 


131 


Nenhuma parte desta publicação poderá ser reproduzida por qualquer meio ou forma sem a prévia autorização da Editora Ibpex. A violação dos direitos autorais é crime estabelecido na Lei nº 9610/1998 e punido pelo art. 184 do Código Penal. 


132 


4. Dois amigos foram caçar. Sabemos que um deles tem 45% de probabili- 
dade de acertar qualquer caça, enquanto o outro tem 60%. Em cada tiro 
disparado, qual é a probabilidade de: 


a) ambos acertarem na mesma caça; 
b) nenhum acertar na mesma caça; 
c) a caça ser atingida; 

d) apenas um acertar a caça. 

Vamos começar pela letra a. 


A probabilidade de ambos acertarem a caça significa dizer que um E outro 


acertaram a caça. Então: 


45 60 
P (ambos acertarem a caça) = — - —— 
100 100 
27 
P (ambos acertarem a caça) = —— 
100 


Agora a letra b. 


A probabilidade de nenhum acertar a caca significa que ambos erraram. 
Como um deles tem 45% de chance de acertar, deduzimos que tem 55% de 
chance de errar. O outro tem 60% de chance de acertar; logo tem 40% de 


chance de errar. Então: 


55 40 
P (nenhum acertar a caça) = — . —— 
100 100 
22 
P (nenhum acertar a caça) = —— 
100 


Aletra c supõe que a caça foi atingida. Logo, sabemos que ou um, ou outro, ou 
ambos atingiram a caça. Não podemos garantir que ambos acertaram. Logo: 
45 60 45 60 


P (a caça ser atingida) = + : 
100 100 100 100 


105 27 


P (a caca ser atingida) = FU = a 


rais é crime estabelecido na Lei nº 9610/1998 e punido pelo art. 184 do Código Penal. 
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78 
P (a caça ser atingida) = 2 


A letra d supóe que apenas um acertou a caca. 


Quando a caca é atingida, ou foi atingida por apenas um, ou por ambos 
(como calculado na letra c), ou foi atingida por ambos (como calculado na 
letra a). Então: 


p 78 27 
apenas um acertar a caça) = —— - —— 
Bp sa) 100 100 
À 51 

apenas um acertar a caça) = — 

(ap ça) 100 


Teorema de Bayes* 


Ao estudarmos a probabilidade condicional, verificamos que P(A | B) e 
P(B | A) são diferentes. 


Por exemplo, se A é o evento de uma pessoa ter sido aprovada em um con- 
curso e se B é o evento de uma pessoa ter sido admitida em um emprego, 
P(BIA) é a probabilidade de a pessoa ser admitida em um emprego, sa- 
bendo-se que, efetivamente, foi aprovada em um concurso. Já P(A IB)éa 
probabilidade de a pessoa ter sido aprovada em um concurso, sabendo-se 


que, efetivamente, foi admitida em um emprego. 
Vimos que: 

P(A ^ B) - P(B)- P(A | B) ou P(A ^ B) =P(A) - P(B | A) 
Igualando essas duas expressões, temos: 

P(A) - P(B | A) = P(B) - P(A | B) 


P(B) - P(A |B) 


P(BlA)- TOJ 


Imaginemos agora um espaço amostral S, participando em um número finito 
de eventos B, onde i varia de 1 até n, de tal forma que a interseção entre 
quaisquer eventos B, é um conjunto vazio (são eventos mutuamente exclusivos) 


e a união de todos os B, é igual ao espaço amostral S. 


* Thomas Bayes (1702-1761) — reverendo e ministro presbiteriano. 
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Figura 1 - Partição de um espaço amostral 5 em um número finito de eventos B, 


Consideremos, agora, um evento A qualquer de S, em que P(A) > 0 (ver 
figura 2). 


Figura 2 - Evento A pertencente ao espaço amostral S 


Temos que: 

A-(B,'^A)u (B, A) u.s (B, A) 
Então: 

P(A) = P(B, ^ A) - P(B; ^ A) * ... € P(B, ^ A) 


Ou seja: 
P(A)- X P(Bj^A) 
i=1 


Como B.B... B. são eventos mutuamente exclusivos e como um evento 


B, deve ocorrer, temos que: 


P(B): P(A | B) 
P(B, | A)- 


X PB) PA B) 


OndeK-710u20u30u ... ou n. 


Dessa análise, concluimos que o teorema de Bayes é uma generalização de 
probabilidade condicional no caso de mais de dois eventos.? 
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Vamos aplicar essa sequéncia lógica do teorema no caso de uma fábrica de 
automóveis, em que três empresas de autopeças participam do processo de 
fabricação fornecendo peças dos tipos I, II e III, respectivamente. As peças 
do tipo I correspondem a 50%, as peças do tipo II correspondem a 20% e as 
peças do tipo III correspondem a 30% da produção total. 


Considerando os dados do quadro abaixo, DETERMINE A PROBABILIDADE DE 
UMA PEÇA DEFEITUOSA QUE VENHA A SER UTILIZADA NA LINHA DE PRODUÇÃO SER 


PROVENIENTE DO FORNECEDOR DE PEÇAS DO TIPO III. 


Porcentagem de Porcentagem de 
Fornecedores 
peças boas peças defeituosas 
Fornecedores de peça I 98 2 
Fornecedores de peça II 99 1 
Fornecedores de peça III 97 3 
Supondo: 


A: o evento de uma peça defeituosa ser utilizada na linha de produção; 
B,: o evento da peça defeituosa ser do tipo L 
B,: o evento da peça defeituosa ser do tipo II; 


B,: o evento da peça defeituosa ser do tipo III. 


P(B) - P(AÍB,) 


P(B,LA)= 
P(B)-P(AIB)+P(B)-P(AIB)+P(B)-P(AIB,) 
(0,30) - (0,03) 
P(B,LA)= 
(0,50) - (0,02) + (0,20) - (0,01) + (0,30) - (0,03) 
0,009 
P(B, |A) = Ue 


P(B, | A) = 04286 ou 42,86% 
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71 Sintese 


Como afirmamos no início deste capítulo, “a probabilidade e a estatística 
estão estreitamente relacionadas, porque formulam tipos opostos de ques- 
tões. Na probabilidade, sabemos como um processo ou experimento fun- 
ciona e queremos predizer quais serão os resultados de tal processo. Em 
estatística, não sabemos como um processo funciona, mas podemos ob- 
servar os seus resultados e utilizar as informações sobre os mesmos para 
conhecer a natureza do processo ou do experimento”. Assim, trabalhando 
em direções diferenciadas, mas não isoladas, a conexão entre as duas áreas 
é bastante oportuna. No entanto, para que ocorra essa interligação, é ne- 
cessário construir vários conhecimentos técnicos durante seu aprendizado. 
Por isso apresentamos aqui um panorama que se constituiu a partir das 
definições e conceitos básicos sobre a teoria das probabilidades, mas que 
revisitou também as concepções, usos e cálculos de componentes proba- 
bilísticos, como: 


e esperança matemática; 

e probabilidades finitas dos espaços amostrais finitos; 

e espaços amostrais finitos equiprováveis; 

e acontecimentos mutuamente exclusivos; 

* regra da adição para eventos mutuamente exclusivos; 
e eventos não mutuamente exclusivos; 


e regra da adição para eventos não mutuamente exclusivos; 
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e acontecimentos simultâneos e sucessivos; 


e probabilidade condicional; 


$ 
$ 


e regra da multiplicação; 
e “independência estatística; 
e Teorema de Bayes. 
Todo esse processo, essa construção de conhecimentos, foi realizado por 


meio da contínua aplicação em contextos explicativos. 


136 


A Questões para revisão 


Nos exercícios a seguir, marque a alternativa correta. 


T 


3. 


4. 


Uma bola é retirada ao acaso de uma urna que contém seis bolas verme- 
Ihas, oito bolas pretas e quatro bolas verdes. Calcule a probabilidade de 


ela nào ser preta. 


( )10/18 ( ) 8/18 
( ) 4/18 ( ) 12/18 
( ) 6/18 


A probabilidade de que Marcella resolva um problema é de 1/3 e a de que 
Luisa o resolva é de 1/4. Se ambas tentarem resolver independentemente 
o problema, qual a probabilidade de ele ser resolvido? 


()7/12 ()2/7 
(91/7 (927 
()12 


Jogamos, uma ünica vez, quatro moedas honestas. Qual a probabili- 
dade, em qualquer ordem, de ter dado coroa em trés das moedas e 
cara na outra moeda? 


( ) 1/8 ( )3/16 
( )3/8 ( )1/16 
( ) 4/16 


Uma carta é retirada de um baralho. Qual a probabilidade de ela ser uma 
dama ou uma carta de paus? 


( )16/52 ( ) 4/52 
C) 17/52 ( ) 13/52 
C) 1/52 
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Uma empresa importadora tem 25% de chance de vender com sucesso 
um produto A e tem 40% de chance de vender com sucesso um produto 
B. Se essa empresa importar os dois produtos, A e B, qual a probabilidade 
de ela ter sucesso na venda ou do produto A, ou do produto B? 


( ) 65/100 ( ) 75/100 
( ) 55/100 ( ) 54/100 
( ) 10/100 


Uma empresa de vendas a varejo tem 60% de chance de vender o pro- 
duto A com sucesso, enquanto o produto B tem apenas 40% de chance 
de ser vendido com sucesso. Se essa empresa tentar vender os pro- 
dutos A e B, qual a probabilidade de ela ter sucesso na venda ou do 
produto A, ou do produto B? 


( ) 100% ( ) 7696 
( ) 60% ( ) 24% 
( ) 40% 


A ação da empresa A, negociada na Bolsa de Valores de São Paulo, 
tem 2576 de chance de subir durante o pregào de determinado dia. 
Nesse mesmo dia, a ação da empresa B, negociada na mesma bolsa de 
valores, tem 20% de chance de subir. Caso um acionista compre ações 
das duas empresas, A e B, nesse dia, qual a probabilidade das ações de 
ambas subirem? 


( ) 596 ( ) 22,596 
( ) 1076 ( ) 40% 
( ) 45% 


Uma urna I contém quatro bolas vermelhas, trés bolas pretas e trés bolas 
verdes. Uma urna II contém duas bolas vermelhas, cinco bolas pretas 
e oito bolas verdes. Uma urna III contém dez bolas vermelhas, quatro 
bolas pretas e seis bolas verdes. Calcule a probabilidade de, retirando-se 
uma bola de cada urna, serem todas da mesma cor. 
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10. 


TL. 


12. 


( ) 80/3000 ( ) 284/3000 
( ) 60/3000 ( ) 140/3000 


( ) 144/3000 


Um pacote de sementes de flores contém quatro sementes de flores ver- 
melhas, trés de flores amarelas, duas de flores roxas e uma de flores de 
cor laranja. Escolhidas, ao acaso, uma após a outra, trés sementes, qual 
a probabilidade de a primeira ser de flor de cor de laranja, a segunda de 


cor vermelha e a terceira de cor roxa? 


C)7/27 ( ) 8/1000 
( ) 242/720 ( ) 7/1000 
( ) 8/720 


Uma caixa contém vinte canetas iguais, das quais sete sáo defeituosas. 
Uma segunda caixa contém doze canetas iguais, das quais quatro são 
defeituosas. Considerando que uma caneta é retirada aleatoriamente de 
cada caixa, determine a probabilidade de uma ser perfeita e a outra não. 


( ) 13/30 ( ) 11/20 
( )9/20 ( ) 11/30 
( ) 7/30 


Uma pessoa tem dois automóveis velhos. Nas manhãs frias, há 20% de 
chance de um deles não pegar e 30% de chance de o outro não pegar. 
Qual a probabilidade de, em uma manhã fria, apenas um pegar? 


( ) 24/100 ( ) 52/100 
( ) 14/100 ( ) 38/100 
( ) 50/100 


Uma fábrica de louças tem um processo de inspeção com quatro etapas. 
A probabilidade de uma peca defeituosa passar numa etapa sem ser de- 
tectada é de aproximadamente 20%. Determine, então, a probabilidade 
de uma peça defeituosa passar por todas as quatro etapas de inspeção 
sem ser detectada. 
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( ) 0,20% ( ) 0,02% 
( ) 0,0016% ( ) 0,80% 
( ) 0,16% 
13. Diferencie em que se baseia a estatística e em que se baseia o cálculo 
de probabilidades. 


14. Quais as características dos fenómenos estudados em estatística? 
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OIS a 


Distribuição binomial 
de probabilidades 


Conteúdos do capítulo 


e Aspectos da distribuição de probabilidades 
e Aspectos da distribuição binomial 

e Parâmetros da distribuição binomial 

e Aplicação da distribuição binomial 


Após o estudo deste capítulo, você será capaz de: 


1. definir distribuição de probabilidades; 
2. aplicar a distribuição binomial em casos práticos. 


Distribuição de probabilidades 


Na maioria dos problemas estatísticos, a amostra não é suficientemente gran- 
de para determinar a distribuição da população de maneira muito precisa. 
Contudo, há normalmente bastante informação na amostra, juntamente com 
a informação obtida de outras fontes, de modo a sugerir o tipo geral da distri- 
buição da população correspondente. Combinando a experiência e a informa- 
ção fornecidas pela amostra, podemos comumente convencionar a natureza 
geral da distribuição da população. Essa convenção leva ao que é conhecido 
como distribuição de probabilidade ou distribuições teóricas.! 


Uma distribuição de probabilidade é um modelo matemático para a distri- 


buição real de frequências. 


Em experimentos do tipo repetitivo (para os quais devemos construir um 
modelo de probabilidade) estamos geralmente interessados em uma pro- 
priedade particular da ocorrência do experimento. Por exemplo, no lança- 
mento de três moedas, o interesse concentra-se sobre o número total de ca- 


ras ou de coroas que aparece, porque é o que conta no jogo de moedas. 


A quantidade escolhida para estudo em tal experimento será simbolizada 
pela letra x. 


Tratando-se de distribuição de probabilidade, a variável x é dita variável 


aleatória. 


Com o objetivo de verificarmos como uma variável aleatória é introduzida num 
experimento simples, voltemos ao espaço amostral da experiência do lança- 
mento de três moedas, já citado anteriormente no capítulo 7 e repetido a seguir. 
Qual a probabilidade de obtermos uma única cara em um lançamento de 
três moedas? 
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Considerando K = cara, C = coroa e sendo A = (deu uma única cara), temos: 
S = (KCC, KKC, KKK, CKC, CKK, CCK, CCC, KCK} 

Então, P(A) = 3/8. 

Vamos analisar esse exemplo com mais detalhes. 


Se x for usado para significar o número total de caras, então cada ponto do 
espaço amostral possuirá o valor x mostrado logo acima do ponto corres- 


pondente, como é representado a seguir. 


3 2 2 2 1 1 1 0 <— variável x 
KKK KKC KCK CKK KCC CKC CCK CCC 
Observemos que a variável x pode assumir qualquer dos valores 0, 1, 2 ou 3, 
mas nenhum outro valor. O valor da variável x só depende do ponto amos- 


tral particular escolhido. Isso significa que x é uma função dos pontos do 
espaço amostral. 


UMA VARIÁVEL ALEATÓRIA é aquela cujos valores são determinados por pro- 
cessos acidentais, ao acaso, que não estão sob o controle do observador. Ela 
pode ser denominada de discreta ou de contínua. 


PARA UMA VARIÁVEL ALEATÓRIA DISCRETA, todos os possíveis valores da va- 
riável podem ser listados numa tabela com as probabilidades correspon- 
dentes. Os específicos modelos discretos de probabilidade que estudare- 
mos são as distribuições de probabilidade binomial (neste capítulo) e a de 
Poisson (no próximo capítulo). 


PARA UMA VARIÁVEL ALEATÓRIA CONTÍNUA, não podem ser listados todos os 
possíveis valores fracionários da variável e, dessa forma, as probabilidades 
determinadas por uma função matemática são retratadas, tipicamente, por 
uma função densidade ou por uma curva de probabilidade. Ela pode assu- 
mir qualquer valor numérico em um intervalo e, como exemplos, temos 
medidas como peso, altura e temperatura, entre outras. Nesse caso, estuda- 
remos a distribuição normal de probabilidade (capítulo 10) e a distribuição 
qui-quadrado (capítulo 11). 


Distribuição binomial 


A distribuição binomial é uma distribuição discreta de probabilidade, apli- 
cável sempre que o processo de amostragem é do tipo do de Bernoulli*. 
Um processo de Bernoulli é um processo de amostragem no qual: 


* Daniel Bernoulli (1700-1782) — nasceu na Holanda, em Groningen, em uma família de grandes 


matemáticos. Obteve o bacharelado na Universidade de Basel, em 1715, e o mestrado em 1716. 
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a) em cada tentativa existem dois resultados possíveis e mutuamente 
exclusivos; eles sáo denominados, por conveniéncia, sucesso e insu- 


cesso (ou fracasso); 


b) as séries de tentativas ou observações são constituídas de eventos 


independentes; 


c) a probabilidade de sucesso, indicada por p, permanece constante de 


tentativa para tentativa; em outras palavras, o processo é estacionário. 


Em geral, se p é a probabilidade de um evento acontecer em uma tentativa 


única, denominada probabilidade de sucesso, e q 7 1 — p é a probabilidade de que 
o evento não ocorra em qualquer tentativa única, denominada probabilidade de 


rt. 184 do Código Penal. 


insucesso, entáo a probabilidade de o evento ocorrer exatamente X vezes em N 
tentativas, isto é, de que haja X sucessos e N — X insucessos, é dada por: 


N! 
XI (N-X)- 


N-X 


P(X) = Cx i p* ` e = 


O nome binomial se deve ao fato de que C: p* - qV* é o termo de ordem 
X em p no desenvolvimento do Binómio de Newton? (q + p)". 


Nessa fórmula, precisamos recordar dois conceitos que você conhece da 


E 
É 


matemática: fatorial e combinação. 


Mas não vamos perder tempo com teorias. Analisaremos alguns exem- 


plos apenas para reativar e relembrar a prática. 


Fatorial de um número N é representado por N! e é dado pela fórmula: 


N!2N-(N-1)-(N-2)-(N-3)-...1 
Então, vamos calcular o fatorial de 5. 
5125.4.3.2.1 

51 2120 


Agora, vamos calcular o fatorial de 9. 
9!=9.8.7-6-5-4-3-2.-1 
9! = 362880 


Como exemplo de variável binomial, temos o experimento que consiste no 
lançamento de uma moeda, no qual, em cada lance, podemos ter sucesso 


ou insucesso no resultado que desejamos. 


144 * Isaac Newton (1642 - 1726) — notável matemático, físico e astrônomo inglés. 


Para o cálculo das combinacóes de N elementos tomados X a X, represen- 


nx já mostrado anteriormente, basta utilizarmos a fórmula: 


tado por C 


N 
C = —— 
NX XI(N-X)! 


Agora, vamos calcular a combinação de cinco elementos tomados três a 
três. Veja. 


5! 5.4.3.2.1 


Ww. 315-3! Sod) 


120 


C.,710 


53 


E, para terminar, vamos calcular a combinação de oito elementos tomados 


cinco a cinco. 


8! 

(C mS 

$5  BI(8—5) 
40320 
120 -6 


=56 


Aplicação da distribuição binomial 


Agora, após recordar um pouco de matemática, vamos analisar exemplos da 


distribuição binomial de probabilidades. 


No primeiro, vamos determinar a probabilidade de ocorrer três vezes o 


nº 6 em cinco (5) lances de um dado honesto. 
P(X) = Cs : p ` qo 


Lembre-se: ao jogar um dado uma única vez, a probabilidade de ocorrer 
qualquer resultado é igual a 1/6. Então, p = 1/6. Consequentemente, a 
probabilidade de não ocorrer esse resultado é igual a 5/6, pois a proba- 
bilidade de sucesso somada à probabilidade de insucesso é igual a 1 (ou 
seja, 100%). Então, q = 5/6. 
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Vamos, então, à solução dessa situação. 


5! 
P(X)- 36-3) - (1/6) - (5/6) 
25 
P(X)- 10- 
216 36 
G 250 
(= 7776 


P(X) = 0,03215 ou 3,215% 


TU + Exercício Resolvido 


Verificou-se, em uma fábrica, que, em média, 10% dos parafusos produ- 
zidos por uma determinada máquina não satisfazem a certas especifica- 
ções. Se forem selecionados, ao acaso, 10 parafusos da produção diária 
dessa máquina, DETERMINE A PROBABILIDADE DE EXATAMENTE TRÊS SEREM 


DEFEITUOSOS. 


Atenção: sucesso é ocorrer o que desejamos. No caso, desejamos que 

os parafusos selecionados sejam defeituosos. Portanto, na estatística o 

sucesso não é necessariamente a parte boa de um experimento. Então, p 
10% 20,1 e q=90% = 0,9. 


P(3 defeituosos) = C..- (0,1? - (0,9)? 


10,3 


P(3 defeituosos) = 120 - 0,001 - 0,4782969 


P(3 defeituosos) = 0,0574 ou 5,74%. 


Parâmetros da distribuição binomial 


Supomos uma variável aleatória x que pode assumir o valor 1, no caso de 


sucesso, e o valor 0, no caso de insucesso (ou fracasso). 


Sendo p a probabilidade de sucesso P(x = 1) = p e q a probabilidade de 
insucesso P(x = 0) = q temos que p+q=1. 


Havíamos definido N como o número de tentativas, e X como o número 
de sucessos. Então, X pode assumir valores de 1 até N e 
E(X) = E(X)) + EGG) * .. + E(X =N. p 
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Como as tentativas são independentes (distribuição de Bernoulli), a variàn- 
cia de X é igual à soma das variâncias de X, X, ..., X,. Logo: 


S-N.p.qeS- NN-p-q 


Seir MR X=E(G)=N-p 
GET ta ass nensi e e ene MeL LUE S?'-N.p:q 
Desvio padrao: oou aut Usted UE S= g 
- : : q-P 
Coeficiente de assimetria: sv: sssssss scs annons oaaao ngata naan As- Ec 
R 
Coeficiente de curtose: ........ e K=3+ SENE 
S 


Vamos aplicar esses cálculos? 


Em 100 lances de uma moeda honesta, qual a média esperada de caras obti- 
das e qual o desvio padráo do experimento? 


X 2100 - (1/2) - 50 

S? = 100 - (1/2) - (1/2) 2 25 

Então: 5-5 

PORTANTO, A MÉDIA É DE 50 E O DESVIO PADRÃO É DE 5. 


Observe novamente que, para a determinação de p e de q, supomos um úni- 
co lançamento da moeda. Lembrar que a moeda é honesta. Logo, a proba- 
bilidade de dar cara é a mesma probabilidade de dar coroa. 


TU Exercícios Resolvidos 


1. Devido às altas taxas de juros, uma empresa informa que 30% de suas 
contas a receber de outras empresas comerciais encontram-se venci- 
das. Se um contador escolher, aleatoriamente, uma amostra de cinco 
contas, DETERMINE A PROBABILIDADE DE EXATAMENTE 20% DESSAS CONTAS 


ESTAREM VENCIDAS. 
Importante lembrar que 20% das contas escolhidas é: 


20% de 5 2 0,20 - 5 = 1 (ou seja, queremos saber a chance de uma única conta 
estar vencida entre as cinco que foram escolhidas pelo contador). 
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N! 
X! (N - XI 


N-X 


BRO Cor Dq 


Lembre-se, também, que 30% das contas estão vencidas. 


Como estamos tentando encontrar uma conta vencida, a probabilidade de 


sucesso é p = 30%, ou seja, p = 0,3. Logo, q = 0,7. 
Então: 
P(X =1) <C. 02 - 0,75 

5! 


P(X = 1) = ————— - 0,3 - 0,2401 
1! (5 - 1)! 


P(X=1) =5 - 0,3 - 0,2401 
P(X=1) = 0,36015 ou 36,015% 


2. Uma firma de pedidos pelos correios enviou uma carta circular que 
tem uma taxa de respostas de 10%. Suponha que 20 cartas circulares 
são endereçadas a uma nova área geográfica, como um teste de mer- 
cado. Considerando que na nova área é aplicável a taxa de respostas 
de 10%, DETERMINE A PROBABILIDADE, USANDO A FÓRMULA DE PROBABILI- 


DADES BINOMIAIS, DE APENAS UMA PESSOA RESPONDER. 


Como a probabilidade de resposta é de 10%, e o sucesso (0 que queremos 
que aconteça) é que uma pessoa responda, p = 0,1, logo, q = 0,9. 


A minha amostra é de 20 cartas. Então, N = 20. 


Como queremos determinar a probabilidade de uma pessoa responder, X = 1. 


N! 
POO 2C... pX. gNX2 ———— HR. qNX 
QQ- Cu y P% q XN-x P 0 
P(X) = Ca - 01! - 0,92 

20! 
P(X-1)- - 0,1 - 0,135085171 
1! Q0 - 1)! 


P(X=1) = 20-0,1- 0,135085171 


P(X=1) = 0,27017 ou 27,017% 
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3. Durante um ano particular, 70% das ações ordinárias negociadas na 
Bolsa de Valores do Rio de Janeiro tiveram sua cotação aumentada, 
enquanto 30% tiveram sua cotação diminuída ou estável. No começo 
do ano, um serviço de assessoria financeira escolhe dez ações como 
sendo especialmente recomendadas. SE AS DEZ AÇÕES REPRESENTAM 
UMA SELEÇÃO ALEATÓRIA, USANDO A FÓRMULA DE PROBABILIDADES BINO- 
MIAIS, QUAL A PROBABILIDADE DE QUE TODAS AS DEZ AÇÕES ESCOLHIDAS 


TENHAM TIDO SUAS COTAÇÕES AUMENTADAS? 
Escolhemos dez ações. Então, N = 10. 


Desejamos que as dez tenham tido sucesso, ou seja, as dez aumentaram suas 
cotações. Então, X = 10. 


A probabilidade de sucesso é de 70%, logo p = 0,7, em consequência, q = 0,3. 


N! 
DBW = C. pX-gNX2 ———— —— .pX.gNX 
LW < Cu y: P* q XN P4 
P(X=10) = Co E 0,710 E 0,2 
10! 
P(X=10)= - 0,028248 - 1 
10! (10-10)! 


Lembre-se: o fatorial de zero, por definição, é igual a 1. 

Lembre-se, também, de que qualquer número real elevado a zero é igual a 1. 
P(X=10) = 1 - 0,028248 - 1 
P(X=10) = 0,028248 ou 2,8248% 


Pelo resultado, verificamos que a chance de as dez ações escolhidas terem, 
todas elas, as suas cotações aumentadas é muito pequena. 


Síntese 


Neste capítulo, o objetivo foi definir a distribuição de probabilidades e cons- 
truir com você, por meio de uma série de aplicações, a competência na apli- 
cação da distribuição binomial. Para isso, foi necessário fazer vários cálculos, 
descrevendo situações diversas de aplicação, e verificar os parâmetros da 
distribuição binomial com suas respectivas equações matemáticas: média, 


variância, desvio padrão, coeficiente de assimetria e coeficiente de curtose. 


149 


Nenhuma parte desta publicação poderá ser reproduzida por qualquer meio ou forma sem a prévia autorização da Editora Ibpex. A violação dos direitos autorais é crime estabelecido na Lei nº 9.610/1998 e punido pelo art. 184 do Código Penal. 


150 


At Questões para revisão 


Nos exercícios a seguir, assinale a alternativa correta. 


1. 


Verifica-se, em uma fábrica, que, em média, 1076 dos parafusos produ- 
zidos por uma determinada máquina não satisfazem a certas especi- 
ficações. Se forem selecionados, ao acaso, oito parafusos da produção 
diária dessa máquina, usando a fórmula de probabilidades binomiais, 


determine a probabilidade de nenhum deles ser defeituoso. 
( ) 0,431% ( ) 43,0576 ( ) 64,98% 
( ) 4,305% ( ) 6,498% 


Em um concurso realizado para trabalhar em determinada empresa 
de exportação, 10% dos candidatos foram aprovados. Se escolhermos, 
aleatoriamente, dez candidatos desse concurso, qual a probabilidade 
de que exatamente dois deles tenham sido aprovados? 


( ) 0,43% ( ) 4396 ( ) 19,3796 
( ) 4396 ( ) 0,193796 


Em determinada turma de uma universidade, em 2006, 2096 dos alunos 
foram reprovados em Matemática Comercial e Financeira. Se escolher- 
mos, aleatoriamente, oito alunos dessa turma, qual a probabilidade de 


exatamente trés desses alunos terem sido reprovados? 
( ) 32,77% ( ) 16,39% ( ) 7,32% 
( ) 0,8% ( ) 14,68% 


Qual a probabilidade de obtermos exatamente cinco coroas em seis lan- 


ces de uma moeda não viciada? 
( ) 937596 ( ) 15,625% ( ) 437596 
( ) 1,562596 ( ) 10,9375% 


Em um ano particular, 3076 dos alunos de determinada faculdade de 
medicina do Estado de Sào Paulo foram reprovados em Clínica Geral. 
Se escolhermos, aleatoriamente, dez alunos dessa universidade que 
tenham cursado Clínica Geral, qual a probabilidade de exatamente 
trés deles terem sido reprovados? 
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( ) 14,6896 ( ) 26,68% ( ) 10,94% 


( ) 2,796 ( ) 8,24% 


Defina o que é uma distribuição de probabilidades. 


O que é uma variável aleatória? 
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Distribuição de Poisson 
de probabilidades 


Conteúdos do capítulo 


e Conceituação da distribuição de Poisson 
e Aplicação da distribuição de Poisson 
e Parâmetros da distribuição de Poisson 


Após o estudo deste capítulo, você será capaz de: 


1. definir a distribuição de Poisson; 
2. aplicar em casos práticos a distribuição de Poisson. 


Distribuição de Poisson* 


A distribuição de Poisson pode ser usada para determinar a probabilidade 
de um dado número de sucessos quando os eventos ocorrem em um conti- 
nuum** de tempo ou espaço. Tal processo, chamado de processo de Poisson, é 
similar ao processo de Bernoulli, exceto que os eventos ocorrem em um 
continuum em vez de de ocorrerem em tentativas ou observações fixadas. 
Um exemplo de tal processo é a chegada de chamadas telefônicas em uma 
central telefônica. Tal como no caso de Bernoulli, supomos que os eventos 
são independentes e que o processo é estacionário. 


SOMENTE UM VALOR É NECESSÁRIO PARA DETERMINAR A PROBABILIDADE DE UM 
DADO NÚMERO DE SUCESSOS EM UM PROCESSO DE PorssoN: o número médio 
de sucessos para a específica dimensão de interesse. Esse número médio é 
geralmente representado por À (lambda)*** ou por u (mu). A fórmula para 
determinarmos a probabilidade de um dado número X de sucessos em 
uma distribuição de Poisson é: 


È 
8 
8 
8 
8 
8 
i 
E 
E 
$ 
i 
à 
8 
$ 
E 
E 
E 
ê 
E 
E 
E 
E] 
E 
& 
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AX. e 


A 
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dH un 


em que "e" é a constante 2,71828 e é a base do logaritmo natural (neperia- 
no), sendo que os valores de e? podem ser obtidos na Tabela 34 (a seguir). 
A representação da P(X | à), lê-se a probabilidade de acontecer X tal que a 
média conhecida é À. 


* Denis Poisson — foi um matemático francês (1781-1840). 


** Série longa de elementos, em uma determinada sequência, em que cada um difere minimamen- 
te do elemento subsequente, daí resultando diferença acentuada entre os elementos iniciais e 


finais da sequência (Dicionário Eletrônico Houaiss da Língua Portuguesa). 


*** 2, é a letra grega minúscula que lemos “lambda” e que corresponde à letra | do nosso alfabeto. 


Caso não tenhamos acesso a uma tabela com os valores de e*, é necessário 


dispor de uma calculadora científica que nos permita determinar tais valores. 


Até agora, temos representado a média ou média aritmética por X. No 
entanto, para o estudo das distribuições de Poisson e normal, nós a re- 


presentaremos por À. 


Tabela 34 — Valores de e? para alguns valores de À. 


A e A e* 
0,0 1,00000 2,5 0,08208 
0,1 0,90484 2,6 0,07427 
0,2 0,81873 2,7 0,06721 
0,3 0,74082 2,8 0,06081 
0,4 0,67032 2,9 0,05502 
0,5 0,60653 3,0 0,04979 
0,6 0,54881 3,2 0,04076 
0,7 0,49659 34 0,03337 
0,8 0,44933 3,6 0,02732 
0,9 0,40657 3,8 0,02237 
10 0,36788 4,0 0,01832 
11 0,33287 42 0,01500 
12 0,30119 44 0,01228 
13 0,27253 4,6 0,01005 
14 0,24660 4,8 0,00823 
1,5 0,22313 5,0 0,00674 
16 0,20190 5,5 0,00409 
17 0,18268 6,0 0,00248 
18 0,16530 6,5 0,00150 
19 0,14957 7,0 0,00091 
2,0 0,13534 7;5 0,00055 
24 0,12246 8,0 0,00034 
2,2 0,11080 8,5 0,00020 
2,3 0,10026 9,0 0,00012 
24 0,09072 10,0 0,00005 
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Aplicação da distribuição de Poisson 


Para entendermos bem esse assunto, nada melhor do que resolvermos al- 


guns casos: 


Por exemplo, se um departamento de conserto de máquinas recebe uma 
média de cinco chamadas por hora, QUAL A PROBABILIDADE DE QUE, EM UMA 
HORA, SELECIONADAS ALEATORIAMENTE, SEJAM RECEBIDAS EXATAMENTE TRÊS 


CHAMADAS? 


.e? 
3l 


P(X-3|X-5)- 


Lembre-se de verificar na tabela 34 o valor de e*: 


125 - 0,00674 
P(X=3|1=5) ^ 0,1404 ou 14,04% 


PORTANTO, A PROBABILIDADE É DE 14,0496. 


Já, se o caso for uma experiéncia de laboratório em que passam, em média, 
em um contador de partículas, quatro partículas radioativas por milisse- 
gundo, QUAL A PROBABILIDADE DE ENTRAREM NO CONTADOR SEIS PARTÍCULAS 
RADIOATIVAS EM DETERMINADO MILISSEGUNDO? 

A média conhecida é igual a 4, ou seja: À = 4 
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AX. e 
P(X-6|2X-4)- 
X! 
6 -4 
PX=6|1-4- — 
4096 - 0,01832 
P(X=6|1=4)= 


720 
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P(X=6 | à= 4) = 0,10422 ou 10,422% 
À PROBABILIDADE É DE 10,422%. 


E, considerando que nos sinais de um transmissor ocorrem distorções alea- 
tórias a uma taxa média de uma por minuto, e as mensagens têm, em média, 
três (3) minutos, ou seja, a ocorrência de distorção é de três por mensagem, 
QUAL A PROBABILIDADE DE O NÚMERO DE DISTORÇÕES EM UMA MENSAGEM DE TRÊS 


MINUTOS SER IGUAL A DOIS (2), UTILIZANDO A FÓRMULA DE POISSON ? 
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Como, em média, ocorre uma distorção a cada minuto, em três minutos 


(tempo da mensagem) deverão ocorrer três distorções. Então, À = 3. 


AX. e 
P(X=2|1=3)= 
x! 
32. e3 
P(X-2|2-3) 
2! 
9 . 0,04979 
P(X=2|1=3)= 
2 
P(X=2 | X23) 202241 ou 22,41% 


Loco, A PROBABILIDADE É DE 22,4196. 


No caso de, em média, quatro pessoas utilizarem, por hora, um determina- 
do telefone püblico, e sabendo que o aparelho, quando apresenta defeito, é 
reparado após uma hora da comunicação do defeito, QUAL A PROBABILIDADE 
DE QUE SOMENTE O RECLAMANTE (SUPONDO QUE ELE FOI O PRIMEIRO A CONSTATAR 


O DEFEITO) NÃO POSSA USAR O TELEFONE DEVIDO AQUELE DEFEITO? 


A média conhecida é À = 4 (quatro pessoas por hora utilizam determinado te- 
lefone público). Queremos conhecer a probabilidade de apenas uma pessoa 
utilizar tal telefone em determinada hora (X = 1). 


1X. e 
P(X=1|1=4)= 

X! 

41.e4 
PX=1|1=4= 

1! 

4- 0,01832 
PpX=1|1=4)= 

1 

P(X=1 | à= 4) = 0,07328 ou 7,328% 


AQUI A PROBABILIDADE É DE 7,232896. 


Considere que, em média, um digitador comete trés erros a cada 6.000 
números teclados. QUAL A PROBABILIDADE DE QUE, NA DIGITAÇÃO DE UM IM- 


PORTANTE RELATÓRIO, COMPOSTO POR 2.000 NÜMEROS, NÀO OCORRAM ERROS? 


Como sáo cometidos, em média, trés erros a cada 6.000 nümeros teclados, 
para 2.000 nümeros teclados é esperado apenas um erro (aplicando-se a 
regra de trés simples). 
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Então, À = 1 (para 2.000 números teclados). 


Queremos determinar a probabilidade de não ocorrerem erros, ou seja, X - 0. 


1º.e 
P(X=0/1=1)= 
0! 
1.0,36788 
P(X=0/A=1)= 
1 
P(X=0 | à= 1) = 0,36788 ou 36,788% 


PORTANTO, A PROBABILIDADE DE ERROS É DE 36,788%. 


fL. 7 Exercício Resolvido 


1. Em cada dez dias chegam, em média, trinta navios à determinada doca. 


Qual a probabilidade de que, em um dia, aleatoriamente escolhido, 


rais é crime estabelecido na Lei nº 9.610/1998 e punido pelo art. 184 do Código Penal. 


cheguem à doca exatamente quatro navios? 


Como em dez dias chegam, em média, 30 navios, em um dia espera-se que 


cheguem três navios (por regra de trés simples), ou seja: À = 3. 


4.63 
Pox =a LA = cymi 
81 - 0,04979 
P(X-4|4-3)- 
24 
P(X -4 | 3) 2 0,1680 ou 16,80% 


RESPOSTA: À PROBABILIDADE DA CHEGADA DE QUATRO NAVIOS É DE 16,80%. 


Parâmetros da distribuição de Poisson 
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Observe que, quando uma variável aleatória x admite distribuição binomial 
com o número N de tentativas muito grande (N > 30) e com a probabilidade 
p de sucesso muito pequena, o uso da fórmula P(X) = C... - p*- d" torna-se 


praticamente inviável! 


e. 2X 
Nessas condições, o valor de P(X) é aproximadamente igual a x” 


em que À = N : p (mesma média da distribuição binomial). 
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Media seneo TTT A=N-p 


ME ru cada dados duda dia rasa diga lata asd alga iai dae S=N-p-q 
Desvio padrão: T S=\ S2 
Coeficiente de assimetria: ionen ai aA ERE e Ten S Ie iRDRS As - 1/S 
Coeficiente de curtose: mrisani K=3+1/Sº 


Vamos aplicar esses parâmetros? 


Sendo que a probabilidade de um indivíduo sofrer uma reação alérgica, re- 
sultante da injeção de determinado soro, é igual a 0,001, determine, então, a 
probabilidade de, entre 2.000 indivíduos, exatamente três sofrerem a mesma 


reação alérgica. 


Seja X = [indivíduo sofre reação alérgica) 


X c. 


P(Xl2)- x 


Observe que a média não foi fornecida. Portanto, para aplicarmos Poisson, 


precisamos calculá-la. 
Temos que =N. p 


à = 2.000 - 0,001 


A=2 
Logo: 

2 .e? 
P(X=3|1=2)= 

3! 

8 - 0,13534 

P(X231222)- 
6 

P(X=3 | A=2)=0,1805 ou 18,05% 


Loco A PROBABILIDADE É DE 18,05%. 
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TU. "Exercícios Resolvidos 


1. A probabilidade da ocorrência de morte por Aids, entre os habitantes 
de determinada comunidade, é de 0,002 por ano. Uma empresa de 
seguros forma um contrato coletivo com essa comunidade que tem 
5.000 habitantes. NESSE CONTEXTO, QUAL A PROBABILIDADE DE QUE CINCO 
HABITANTES DESSE GRUPO MORRAM DE AIDS NO PRIMEIRO ANO DE EXISTÊN- 


CIA DA APÓLICE? 
A média de mortalidade não foi fornecida. Precisamos calculá-la. 
A=N-p 


À = 5.000 - 0,002 


rais é crime estabelecido na Lei nº 9610/1998 e punido pelo art. 184 do Código Penal. 


A=10 
Logo: 
105. e” 
P(X=511=10)= 
5! 

100.000 - 0,00005 

P(X=51A 
120 

P(X=5 | à =10) = 0,04167 ou 4,167% 


RESPOSTA: À PROBABILIDADE É DE 4,167%. 


2. Uma companhia de seguros está considerando a inclusão da cobertu- 
ra de uma doença relativamente rara na área geral de seguros médi- 
cos. A probabilidade de que um indivíduo, selecionado aleatoriamen- 
te, venha a contrair a doença é 0,001, sendo que 3.000 pessoas estão 
incluídas no grupo segurado. Sendo assim, qual o número esperado 
de pessoas, no grupo, que terão a doença? Qual a probabilidade de 
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que nenhuma das 3.000 pessoas do grupo contraia a doença? 
A média esperada (número esperado de pessoas que terão a doença) é: 
A=N-p 
À = 3000 - 0,001 


A=3 
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SIGNIFICA QUE O NÚMERO ESPERADO DE PESSOAS QUE TERÃO A DOENÇA É DE 3. 


Logo: 

0.e3 
P(X=011=3)= 

0! 
1-0,04979 
P(X=011=3)= 
1 

P(X=0 | à = 3) = 0,04979 ou 4,979% 


RESPOSTA: À PROBABILIDADE DE NENHUMA CONTRAIR A DOENÇA É DE 4,979%. 


3. A probabilidade de uma pessoa sofrer intoxicação alimentar na lan- 
chonete de determinado bairro de baixa renda é de 0,001. DETERMINE A 
PROBABILIDADE DE QUE, DAS 1.000 PESSOAS QUE VÃO POR DIA NESSA LAN- 


CHONETE, EXATAMENTE DUAS SE INTOXIQUEM. 


A média esperada de intoxicação é: 
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A=N-p 


à = 1000 - 0,001 


RESPOSTA: PORTANTO, A PROBABILIDADE É DE 18,394%. 


jd l 
Logo: i 
12. e : 
P=: A i 
1-0,36788 j 
P(X=2|4=1)= d 
2 i 

P(X -2 | à= 1) = 0,18394 ou 18,394% i 
i 
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A Sintese 


Neste capítulo, tratamos especificamente da definição e aplicação da dis- 
tribuição de Poisson. Tal distribuição, elaborada pelo matemático francês 
Denis Poisson, serve para verificarmos as probabilidades em eventos que 
ocorrem em movimento contínuo, ao contrário da distribuição binomial 
(desenvolvida por Bernoulli), que ocorrem em observações fixas. Os pa- 
râmetros referem-se aos mesmos fenômenos, em ambas, isto é: média, va- 


riância, desvio padrão, coeficiente de assimetria e coeficiente de curtose. 


71 Questões para revisão 


Assinale a alternativa correta nos exercícios abaixo. 


1. Na fabricação de resistores de 50 ohms, são considerados bons os que 
têm resistência entre 45 e 55 ohms. Sabe-se que a probabilidade de um 
deles ser defeituoso é 0,2%, sendo que são vendidos em lotes de 1.000 
unidades. Nesse caso, qual a probabilidade de um resistor ser defeitu- 
oso, em um lote? 


()13,534% — ()27068%  ()0,27196 


( 6,767% ()0,135% 


2. Sendo a probabilidade de uma pessoa sofrer reação alérgica, resultante 
da injeção de determinado soro, ser igual a 0,0002, determine a probabi- 
lidade de, entre 5.000 pessoas, exatamente três sofrerem a mesma reação 
alérgica. 
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()36,788%  ()13,534% . ()0,67496 
( ) 0,833% () 6,13% 


3. Em média, oito pessoas por dia consultam um especialista em decoração 
de determinada fábrica. Qual a probabilidade de que, em um dia selecio- 
nado aleatoriamente, exatamente três pessoas façam tal consulta? 
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( ) 2,90% ( ) 14,66% ( ) 58,0296 
() 29,01% ( ) 5,80% 


Um departamento de conserto de máquinas recebe, em média, quatro 
chamadas por hora. Qual a probabilidade de que, em uma hora, sele- 


cionada aleatoriamente, sejam recebidas exatamente duas chamadas? 
( ) 1,83% ( ) 7,3396 ( ) 18,3096 
( ) 14,66% ( ) 3,66% 


Em Tóquio, ocorrem, em média, seis suicídios por més. Calcule a pro- 
babilidade de, em um més, selecionado aleatoriamente, ocorrer exata- 


mente dois suicídios. 
( ) 0,74% ( ) 8,93% ( ) 4,46% 


( ) 7,4496 ( ) 44,64% 


Defina a utilização da distribuição de Poisson. 


Quantos valores são necessários para determinar a probabilidade de 


um dado número de sucessos em um processo de Poisson? 
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Distribuição normal 
de probabilidades 


Conteúdos do capítulo 


e Conceituação e características da distribuição normal 
e Aplicação da distribuição normal 
e Parâmetros da distribuição normal 


Após o estudo deste capítulo, você será capaz de: 


1. definir distribuição normal de probabilidades; 
2. aplicar a distribuição normal de probabilidades em situações concretas. 


Distribuição normal 


A distribuição normal de probabilidade é uma distribuição de probabilidade 
contínua que é simétrica em relação à média e mesocúrtica e assíntota em 
relação ao eixo das abscissas, em ambas as direções. A curva que representa 
a distribuição normal de probabilidade é frequentemente descrita como 
tendo uma forma de sino, sendo também conhecida como Curva de Gauss* 


(veja a figura 3). 


bre. A violação 


Inicialmente, supunha-se que todos os fenômenos da vida real devessem 
ajustar-se a uma curva em forma de sino; caso contrário, suspeitava-se de 
alguma anormalidade no processo de coleta de dados. Daí a designação 


de curva normal. 


* Joham Carl Friedrich Gauss (1777-1855) — famoso matemático, astrônomo e físico alemão, era conhe- 


cido como o príncipe dos matemáticos. 


Figura 3 - Curva representativa da distribuição normal de probabilidade 


f(x) À 


> X 


À DISTRIBUIÇÃO DE PROBABILIDADE NORMAL É IMPORTANTE NA INFERÊNCIA ES- 


TATÍSTICA POR TRÊS RAZÕES DISTINTAS: 


a) as medidas produzidas em diversos processos aleatórios seguem 
essa distribuição; 


b) as probabilidades normais podem ser usadas frequentemente como 
aproximações de outras distribuições de probabilidade, tais como a 
binomial e a de Poisson; 


c) as distribuições de estatísticas da amostra, tais como a média e a 
proporção, frequentemente seguem a distribuição normal indepen- 
dentemente da distribuição da população. 


Como para qualquer distribuição contínua de probabilidade, o valor da 
probabilidade pode somente ser determinado para um intervalo de valo- 
res da variável. 


A altura da função densidade (ou curva de probabilidade) para uma variá- 


vel normalmente distribuída é dada por: 


f(X) = EE JI Q0 
S-N2:n 


Em que: 


f(X) = variável dependente. 

X = variável independente. 

À = média. 

S = desvio padrão da distribuição. 

e = 2,71828... (base do sistema de logaritmos neperianos). 


n = 3,14159... 
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Observe que, mais uma vez, representamos a média (ou média aritmética) 
pela letra À. 


Uma vez que cada combinação de À e de S geraria uma distribuição normal 
de probabilidade diferente (todas simétricas e mesocürticas), as tabelas de 
probabilidades da normal são baseadas em uma distribuição normal de 
probabilidade com A =0 e S=1. 


Qualquer conjunto de valores X, normalmente distribuídos, pode ser con- 
vertido em valores normais z padronizados pelo uso da fórmula: 
X-2X 
S 


z= 


A Tabela 35 indica as proporções de área para vários intervalos de valores 
para a distribuição de probabilidade normal padronizada, com a fronteira 
inferior do intervalo começando sempre na média. A conversão dos va- 
lores dados da variável X em valores padronizados torna possível o uso 
dessa tabela e faz com que seja desnecessário o uso da equação de densi- 
dade de qualquer distribuição normal dada. 
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Tabela 35 — Áreas de uma distribuição normal padrão*. 


Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 
0,0 | 0,0000 | 0,0040 | 0,0080 | 0,0120 | 0,0160 | 0,0199 | 0,0239 | 0,0279 | 0,0319 | 0,0359 
0,1 | 0,0398 | 0,0438 | 0,0478 | 0,0517 | 0,0557 | 0,0596 | 0,0636 | 0,0675 | 0,0714 | 0,0753 
0,22 | 0,0793 | 0,0832 | 0,0871 | 0,0910 | 0,0948 | 0,0987 | 0,1026 | 0,1064 | 0,1103 | 0,1141 
03 | 0,1179 | 0,1217 | 0,1255 | 0,1293 | 0,1331 | 0,1368 | 0,1406 | 0,1443 | 0,1480 | 0,1517 
04 | 0,1554 | 0,1591 | 0,1628 | 0,1664 | 0,1700 | 0,1736 | 0,1772 | 0,1808 | 0,1844 | 0,1879 
05 | 0,1915 | 0,1950 | 0,1985 | 0,2019 | 0,2054 | 0,2088 | 0,2123 | 0,2157 | 0,2190 | 0,2224 
0,6 | 0,2257 | 0,2291 | 0,2324 | 0,2357 | 0,2389 | 0,2422 | 0,2454 | 0,2486 | 0,2517 | 0,2549 
0,7 | 0,2580 | 0,2611 | 0,2642 | 0,2673 | 0,2703 | 0,2734 | 0,2764 | 0,2794 | 0,2823 | 0,2852 
0,8 | 0,2881 | 0,2910 | 0,2939 | 0,2967 | 0,2995 | 0,3023 | 0,3051 | 0,3078 | 0,3106 | 0,3133 
0,9 | 0,3159 | 0,3186 | 0,3212 | 0,3238 | 0,3264 | 0,3289 | 0,3315 | 0,3340 | 0,3365 | 0,3389 
LO | 0,3413 | 0,3448 | 0,3461 | 0,3485 | 0,3508 | 0,3531 | 0,3534 | 0,3577 | 0,3599 | 0,3621 
11 | 0,3643 | 0,3665 | 0,3686 | 0,3708 | 0,3729 | 0,3749 | 0,3770 | 0,3790 | 0,3810 | 0,3830 
1,2 | 0,3849 | 0,3869 | 0,3888 | 0,3907 | 0,3925 | 0,3944 | 0,3962 | 0,3980 | 0,3997 | 0,4015 
13 | 0,4032 | 0,4049 | 0,4066 | 0,4082 | 0,4099 | 0,4115 | 0,4131 | 0,4147 | 0,4162 | 0,4177 
14 | 0,4192 | 0,4207 | 0,4222 | 0,4236 | 0,4251 | 0,4265 | 0,4279 | 0,4292 | 0,4306 | 0,4319 
1,5 | 0,4332 | 0,4345 | 0,4357 | 0,4370 | 0,4382 | 0,4396 | 0,4406 | 0,4418 | 0,4429 | 0,4441 
1,6 | 0,4452 | 0,4463 | 0,4474 | 0,4484 | 0,4495 | 0,4505 | 0,4515 | 0,4525 | 0,4535 | 0,4545 
17 | 0,4554 | 0,4564 | 0,4573 | 0,4582 | 0,4591 | 0,4599 | 0,4608 | 0,4616 | 0,4625 | 0,4633 
18 | 0,4641 | 0,4649 | 0,4656 | 0,4664 | 0,4671 | 0,4678 | 0,4686 | 0,4693 | 0,4699 | 0,4703 
19 | 0,4713 | 0,719 | 0,4726 | 0,4732 | 0,4738 | 0,4744 | 0,4750 | 0,4756 | 0,4761 | 0,4767 
20 | 0,4772 | 06,4778 | 0,4783 | 0,4788 | 0,4793 | 0,4798 | 0,4803 | 0,4808 | 0,4812 | 0,4817 
21 | 0,4821 | 0,4826 | 0,4830 | 0,4834 | 0,4838 | 0,4842 | 0,4846 | 0,4850 | 0,4854 | 0,4857 
2,22 | 0,4861 | 0,4864 | 0,4868 | 0,4871 | 0,4875 | 0,4878 | 0,4881 | 0,4884 | 0,4887 | 0,4890 
2,3 |0,4893 | 0,4896 | 0,4898 | 0,4901 | 0,4904 | 0,4906 | 0,4909 | 0,4911 | 0,4913 | 0,4916 
2,4 | 0,4918 | 0,4922 | 0,4922 | 0,4925 | 0,4927 | 0,4929 | 0,4931 | 0,4932 | 0,4934 | 0,4936 
2,5 | 0,4938 | 0,4940 | 0,4941 | 0,4943 | 0,4945 | 0,4946 | 0,4948 | 0,4949 | 0,4951 | 0,4952 
2,6 | 0,4953 | 0,4955 | 0,4956 | 0,4957 | 0,4959 | 0,4960 | 0,4961 | 0,4962 | 0,4963 | 0,4964 
2,7 | 0,4965 | 0,4966 | 0,4967 | 0,4968 | 0,4969 | 0,4970 | 0,4971 | 0,4972 | 0,4973 | 0,4974 
2,8 | 0,4974 | 0,4975 | 0,4976 | 0,4977 | 0,4977 | 0,4978 | 0,4979 | 0,4979 | 0,4980 | 0,4981 
29 | 0,4981 | 0,4982 | 0,4982 | 0,4983 | 0,4984 | 0,4984 | 0,4985 | 0,4985 | 0,4986 | 0,4986 
3,0 | 0,4987 | 0,4987 | 0,4987 | 0,4988 | 0,4988 | 0,4989 | 0,4989 | 0,4989 | 0,4990 | 0,4990 


* Cada casa na tabela dá a proporção sob a curva inteira entre z = 0 e um valor positivo de z. As áreas para 


os valores de z negativos são obtidas por simetria. 
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Aplicação da distribuição normal 


Vamos, agora, conferir, por meio de um exemplo prático, a distribuição de 
probabilidade padronizada? 


Sabemos que a vida útil de determinado componente elétrico segue uma 
distribuição normal com média À = 2.000 horas e desvio padrão S = 200 
horas. QUAL É A PROBABILIDADE DE QUE UM COMPONENTE ELÉTRICO, ALEATO- 


RIAMENTE SELECIONADO, DURE ENTRE 2.000 E 2.400 HORAS? 


Figura 4 - Curva de probabilidade para vida útil do componente 


f(x) À 
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n— 


1.400 1.600 1.800 2.000 2.200 2.400 2.600 


> X (horas) 


> Z (unidades 
-3 -2 .-1 0 +1 +2 +3 padronizadas) 


A Figura 4 retrata a curva de probabilidade (função densidade) para esse 
problema e indica, também, a relação entre a escala de horas X e a escala 


da normal padronizada z. 

OBSERVE A ÁREA SOB A CURVA CORRESPONDENTE AO INTERVALO DE 2.000 a 2.400 
HORAS. 

A fronteira inferior do intervalo está na média da distribuição e, portanto, está 


no valor z = 0. A fronteira superior do intervalo, em termos de valor de z, é: 
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X-A 2.400 — 2.000 
S 200 


z- 


+2,0 


De acordo com a Tabela 35, verificamos que: 
P(0 < z < +2,0) = 0,4772. 

Portanto: 

P(2.000 < X < 2.400) = 0,4772 ou 47,72 %. 


(Expectativa de vida útil do componente.) 
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O Quz Isso SIGNIFICA? Significa que a área limitada pela curva e pelo eixo 
horizontal X, para valores de z, variando de 0 até +2, corresponde a 47,72% 
da área total. 


É claro que nem todos os problemas envolvem intervalos tendo a média 
como fronteira inferior. Contudo, a tabela de áreas de uma distribuição nor- 
mal padráo pode ser usada para determinar o valor de probabilidade asso- 
ciado com qualquer intervalo dado, tanto por adição ou subtração apropria- 


das de áreas como pelo reconhecimento de que a curva é simétrica. 


Agora, com respeito aos componentes elétricos descritos no caso analisado, 
SUPONHAMOS UMA SEGUNDA SITUAÇÃO: QUE ESTIVÉSSEMOS INTERESSADOS NA 
PROBABILIDADE DE QUE UM COMPONENTE, ALEATORIAMENTE ESCOLHIDO, DURAS- 


SE MAIS DO QUE 2.200 HORAS. 


Observe que o ponto em que z = 0 corresponde à metade da curva normal. 
Logo a proporção total da área à direita da média na Figura 5 é igual a 
0,5000, 50% da área total. Portanto, se determinarmos a proporção entre a 
média e 2.200, podemos subtrair esse valor de 0,5 para obtemos a probabili- 
dade de que as horas X sejam maiores do que 2.200. 


Figura 5 — Curva de probabilidade para componente com mais de 2200 
horas de vida útil 


f(x) À 


—— + 


1.400 1.600 1.800 2.000 2.200 2.400 2.600 


» X (horas) 


» Z (unidades 


ego 2. =l 0 +1 o 338 padronizadas) 
2.200 — 2.000 
z9— M =+1,0 
200 


P(0 < z < 41,0) = 0,3413 


P(z > +1,0) = 0,5000 — 0,3413 = 0,1587 
Portanto: 


P(X > 2200) = 0,1587 ou 15,87%. 
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ASSIM, A PROBABILIDADE DO COMPONENTE DURAR MAIS DE 2.200 HORAS É DE 
15,8796. 


Parámetros da distribuição normal 


Medid RM LÁ A-N-p 
KTT ""—————— S?'-N.p:q 
[See be f ———— S-Ng 
(Coeficiente de assimetrias «u.a ete entrate tne RT gyi ayi As=0 
Coeficiente aT K=3 


Vamos aplicar esses parâmetros em situações concretas para melhor enten- 
dimento. Nesse contexto, considerando que os pesos dos alunos de deter- 
minada escola têm uma distribuição normal com média de 50 kg e desvio 
padrão de 5 kg, VAMOS VERIFICAR QUAL A PORCENTAGEM DE ALUNOS DESSA ES- 


COLA COM PESO: 

a) abaixo de 45 kg; 

b) acima de 60 kg; 

C) entre 48 kg e 58 kg. 

VAMOS COMEÇAR CALCULANDO QUANTOS ALUNOS TÊM PESO ABAIXO DE 45 KG. 


Para melhor visualizarmos o problema, é sempre recomendável que faça- 


mos o gráfico correspondente (veja a Figura 6). 


Figura 6 - Curva de probabilidade para porcentagem de alunos x peso 


f(x) A 


> X (kg) 


> Z (unidades 
-3 -2 -1 0 +1 +2 +3 padronizadas) 
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Como estamos interessados em todos os alunos abaixo de 45 kg, desejamos 
saber qual é a área abaixo da curva e à esquerda de 45 kg. 


Então, para X = 45, temos: 


X-A 45-50 
z- = --10 


S 5 


P(-1 < z < 0) = 0,3413 


P(z < -1,0) = 0,5000 — 0,3413 = 0,1587 
Portanto: 
P(X < 45) = 0,1587 ou 15,87 96. 


VAMOS CALCULAR AGORA QUE PERCENTUAL DE ALUNOS TEM ACIMA DE 60 Kc, OU 
SEJA, X 2 60. 


X-A 60-50 
z- -—.—-20 


P(0 < z < +2,0) = 0,4772 

Portanto: 

P(50 < X < 60) = 0,4772 ou 47,72 % 

Então, acima de 60 kg temos: 

P(X > 60) = 50 % — 47,72 % = 2,28 % 

POR ÚLTIMO, VAMOS VERIFICAR QUANTOS ALUNOS PESAM ENTRE 48 KG E 58 KG. 


Para X = 48, temos: 


X-X 48 — 50 
z= = =- 0,4 


S 5 


Para X = 58, temos: 


X-X 58-50 
z- de - BB 


Agora lembre-se: toda análise deve ser feita a partir da média, ou seja, a 


partir de z igual a zero. 
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Estamos interessados em saber o percentual abaixo da curva entre os va- 
lores de: 

z--04ez--156. 

Então: 

P(- 0,4 < z < 0) = 0,1554 

Portanto: 

P(48 < X < 50) = 0,1554 ou 15,54% 

e P(0 < z < 1,6) = 0,4452 

Portanto: 

P(50 < X < 58) = 0,4452 ou 44,52% 
Somando os dois intervalos, temos: 


P(48 < X < 58) = 0,1554 + 0,4452 = 0,6006 ou 60,06% dos alunos. 


TU "Exercícios Resolvidos 


1. Suponhamos que a renda média de uma grande comunidade possa 
ser razoavelmente aproximada por uma distribuição normal com mé- 
dia de R$ 1.500,00 e desvio padrão de R$ 300,00. Nessa situação: 

a) Qual a porcentagem da população que tem renda superior a 
R$ 1.860,00? 

b) Qual a porcentagem da população que tem renda inferior a 
R$ 1.000,00? 

c) Qual a porcentagem da população que tem renda entre R$ 1.050,00 
e R$ 1.780,00? 

d) Numa amostra de 500 assalariados, quantos podemos esperar que 
tenham menos de R$ 1.050,00 de renda? 


Vamos começar por fazer o gráfico (veja a Figura 7). 
Figura 7 - Curva de probabilidade para o exercício 1 


f(x) À 


| | | | | : > X (R$) 
600 900 1.200 1.500 1.800 2.100 2.400 
» Z (unidades 


-3 -2 -1 0 +1 +2 +3 padronizadas) 
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VAMOS, ENTÃO, VERIFICAR QUAL A PORCENTAGEM DA POPULAÇÃO QUE TEM RENDA 
SUPERIOR A R$ 1.860,00. 


Para X = 1.860, temos: 


X-A  1860-1.500 
S 300 


z- 


*12 


Então: 

P(0 < z < 1,2) = 0,3849 

Portanto: 

P(1.500 < X < 1.860) = 0,3849 ou 38,49% 


Nesse caso, salários maiores que R$ 1.860,00 correspondem aos valores de 


z maiores que 1,2. Assim: 


P(X > 1.860) = 0,5 — 0,3849 = 0,1151 ou 11,51% DA POPULAÇÃO TEM RENDA 
SUPERIOR A R$ 1.860,00. 


Verifiquemos agora o percentual da população que tem renda inferior a 
R$ 1.000,00. 


Para X = 1.000, temos: 


X-A 1.000- 1.500 - 
S 300 


—1,67 


Então: 

P(-1,67 < z < 0) = 0,4525 

Portanto: 

P(1.000 < X < 1.500) = 0,4525 ou 45,25% 


Nesse caso, salários menores que R$ 1.000,00 correspondem aos valores de 


z menores que - 1,67. Assim: 


P(X < 1.000) = 0,5 — 0,4525 = 0,0475 ou 4,75% DA POPULAÇÃO TEM RENDA IN- 
FERIOR A R$ 1.000,00. 


AGORA, VAMOS VERIFICAR QUAL A PORCENTAGEM DA POPULAÇÃO QUE TERÁ REN- 
DA ENTRE R$ 1.050,00 £ R$ 1.780,00. 


Para X = 1.050, temos: 
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X-A  1.050- 1.500 
z= = == lo 


S 300 


Então: 

P(-1,5 < z < 0) = 0,4332 

Portanto: 

P(1.050 < X < 1.500) = 0,4332 ou 43,32% 


Para X = 1.780, temos: 


X-A 1.780 - 1.500 
z- - -4 0,93 
S 300 


Então: 

P(0 < z < +0,93) = 0,3238 

Portanto: 

P(1.500 < X < 1.780) = 0,3238 ou 32,38% 

Somando-se os dois intervalos, temos: 

P(1.050 < X < 1.780) = 0,4332 + 0,3238 = 0,757 ou 75,7% DA POPULAÇÃO. 


ESTAMOS, AGORA, INTERESSADOS EM SABER, NUMA AMOSTRA DE 500 ASSALARIA- 


DOS, QUANTOS PODEMOS ESPERAR QUE TENHAM RENDA MENOR QUE R$ 1.050,00. 


Nós acabamos de calcular que para rendas entre R$ 1.050,00 e R$ 1.500,00 
temos 43,32% da população. Então, abaixo de R$ 1.050,00, temos: 


5096 — 43,32% = 6,68%. 
RESPOSTA: PORTANTO, 6,68% TEM RENDA ABAIXO DE R$ 1.050,00. 


2. Analisando os resultados das avaliações dos 2.000 alunos de certa es- 
cola, verificou-se que as notas têm uma distribuição aproximadamen- 
te normal com média igual a 6 e desvio padrão igual a 1. QUANTOS 


ALUNOS PODEMOS ESPERAR QUE TENHAM TIRADO NOTA: 
a) inferior a 5; 

b) superior a 7,5; 

c) entre 6,5 e 8,5. 


Vamos começar pelo gráfico (veja a Figura 8). 
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Figura 8 - Curva de probabilidade para o exercício 2 


f(x) A 


> X (notas) 


> Z (unidades 
-3 -2 -1 0 +1 +2 +3 padronizadas) 


INICIALMENTE, QUEREMOS SABER QUANTOS ALUNOS TIRARAM NOTA MENOR QUE 


5,0. VAMOS CALCULAR O PERCENTUAL DELES. 


Para X = 5, temos: 


Então: 

P(-1,0 < z < 0) = 0,3413 
Portanto: 

P(5 < X < 6) = 0,3413 ou 34,13% 


Como estamos interessados em notas inferiores a 5,0, queremos conhecer 


o percentual à esquerda de z igual a -1,0. 

No caso, temos: 

0,5 — 0,3413 = 0,1587 ou 15,87% dos alunos. 

Como são 2.000 alunos, 15,87% deles corresponde a: 
2.000 - 0,1587 = 317,4 


RzsPosrA: LOGO, ESPERAMOS ENCONTRAR 317 ALUNOS COM NOTA INFERIOR A 
5,0. 


Não se esqueça de arredondar o resultado. Não podemos ter 0,4 aluno! 
E QUANTOS ALUNOS DEVEM TER TIRADO NOTA SUPERIOR A 7,5? 


Para X = 7,5, temos: 
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Entào: 

P(0 < z < +1,5) = 0,4332 

Portanto: 

P(6 < X < 7,5) = 0,4332 ou 43,32% 


Mas estamos interessados nas notas superiores a 7,5. Então, estamos inte- 


ressados no percentual da área sob a curva a partir dez igual a *1,5. 
Logo, temos: 

0,5 — 0,4332 = 0,0668 ou 6,68% 

Como são 2.000 alunos, 6,68% deles corresponde a: 

2.000 . 0,0668 = 133,6 


Resposta: Loco, COM NOTA SUPERIOR A 7,5, ESPERAMOS ENCONTRAR 134 ALUNOS. 


AGORA, VAMOS DETERMINAR QUANTOS ALUNOS TIRARAM NOTA ENTRE 6,5 E 8,5. 


Para X = 6,5, temos: 


Então: 

P(0 < z < +0,5) = 0,1915 

Portanto: 

P(6 < X < 6,5) = 0,1915 ou 19,15% dos alunos. 


Para X = 8,5, temos: 


Então: 


P(0 < z < +2,5) = 0,4938 
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Portanto: 
P(6 < X € 8,5) = 0,4938 ou 49,38% dos alunos. 


Se 49,38% dos alunos tiraram nota entre 6,0 e 8,5 e se 19,15% dos alunos 
tiraram nota entre 6,0 e 6,5, então 30,23% (49,38% — 19,15% = 30,23%) dos 


alunos tiraram nota entre 6,5 e 8,5. 

Como temos 2.000 alunos, 30,23% deles corresponde a: 

2.000 - 0,3023 = 604,6 

Resposta: Logo, COM NOTA ENTRE 6,5 E 8,5, ESPERAMOS ENCONTRAR 605 ALUNOS. 


3. Por intermédio de documentação e observação cuidadosas, constatou- 
se que o tempo médio para se fazer um teste padrão de estatística é 
aproximadamente normal com média de 80 minutos e desvio padrão 


de 20 minutos. Com BASE NESSES DADOS, RESPONDA: 


a) Que percentual de candidatos leva menos de 80 minutos para fazer o 
teste? 


b) Que percentual de candidatos não termina o teste se o tempo máximo 
concedido for de duas horas? 


c) Se 100 pessoas fazem o teste, quantas podemos esperar que terminem 


o teste na primeira hora? 
Vamos ao gráfico. 
Figura 9 - Curva de probabilidade para o exercício 3 


f(x) À 


> X (minutos) 


20 40 60 80 100 120 140 


> Z (unidades 
-3 -2 -1 0 +I +2 +3 padronizadas) 
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Vamos, então, calcular que percentual de candidatos leva menos de 80 mi- 
nutos para fazer o teste. 


Para X = 80, temos: 


z- = 


S 20 


X-A 80 - 80 
-0 


Resposta: Como z = 0, TEMOS À SUA ESQUERDA 50% DA CURVA. Loco 50% DOS 


CANDIDATOS LEVA MENOS DE 80 MINUTOS PARA FAZER O TESTE. 


Agora, vamos calcular que percentual de candidatos não termina o teste se 
o tempo máximo concedido for de duas horas, ou seja, 120 minutos. 


Para X = 120, temos: 


X- 120 - 80 
S 20 


+2,0 


Então: 

P(0 < z < +2,0) = 0,4772 

Portanto: 

P(80 < X < 120) = 0,4772 ou 47,72% 


Como estamos interessados em tempos maiores que 120 minutos, quere- 


mos a área abaixo da curva e à direita de z igual a +2,0. 

Então, temos: 

0,5 — 0,4772 = 0,0228 ou 2,28% dos candidatos. 

ReEsPosTA: 2,2896 DOS CANDIDATOS. 

FINALMENTE, QUEREMOS SABER QUANTOS CANDIDATOS PODEMOS ESPERAR QUE 


TERMINEM O TESTE NA PRIMEIRA HORA (60 MINUTOS), SUPONDO-SE QUE SEJAM 


100 PESSOAS A FAZER O TESTE. 


Para X = 60, temos: 
X- 60 — 80 

S æ 
Como queremos saber quantos candidatos levam no máximo uma hora 


z- 


10 


(60 minutos) para fazer o teste, estamos interessados na área abaixo da 


curva e à esquerda de z igual a —1,0. 


Nenhuma parte desta publicação poderá ser reproduzida por qualquer meio ou forma sem a prévia autorização da Editora Ibpex. A violação dos direltos autorais é crime estabelecido na Lei nº 9610/1998 e punido pelo art. 184 do Código Penal. 


Então: 

P(-1,0 < z < 0) = 0,3413 

Portanto: 

P(60 < X < 80) = 0,3413 ou 34,13% 

Como estamos interessados em tempos menores que 60 minutos, temos: 
0,5 — 0,3413 = 0,1587 ou 15,87% dos candidatos. 

São 100 pessoas. Então: 

100 . 0,1587 = 15,87 

Resposta: Loco, 16 PESSOAS DEVEM TERMINAR O TESTE NA PRIMEIRA HORA. 


4. Em um exame de estatística, a média foi igual a 78 e o desvio padrão 
foi igual a 10. NESSE caso: 


a) determine os escores padronizados ou a variável normal padronizada 


de dois estudantes cujas notas foram 93 e 52; 
b) determine as notas cujos escores reduzidos foram - 0,6 e 1,2. 


Para X = 93, a variável normal padronizada (z) vale: 


X-A 93 - 78 
zz E = 


S 10 


41,5 


O escore padronizado é + 1,5. 


Para X = 52, a variável normal padronizada (z) vale: 


X-A 52 -78 
z= = =-2,6 


S 10 


O escore padronizado é — 2,6 
Para z = — 0,6, o correspondente grau é: 


X- 
S 


Z= 
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-6-X-78 
X=78-6 
Resposta: X = 72 


Para z = + 1,2, o grau correspondente é: 


X-A 
Z= 
S 
X-78 

12-2 

10 
122X-78 
X=12+78 


Resposta: X = 90 


5. O processo de empacotamento em uma companhia de cereais foi ajus- 


rais é crime estabelecido na Lei nº 9610/1998 e punido pelo art. 184 do Código Penal. 


tado de maneira que uma média de À = 13,00 kg de cereal é coloca- 


da em cada saco. É claro que nem todos os sacos têm precisamente 
13,00 kg devido a fontes aleatórias de variabilidade. O desvio padrão 
do peso líquido é S = 0,1 kg e sabemos que a distribuição dos pesos 
segue uma distribuição normal. DETERMINE A PROBABILIDADE DE QUE 
UM SACO, ESCOLHIDO ALEATORIAMENTE, CONTENHA ENTRE 13,00 E 13,20 


KG DE CEREAL. 


Para X = 13,00, temos: 


X-X 13 - 13 
z= = =0 


S 0,1 
Para X = 13,20, temos: 


X-A 13,20 - 13 
S 0,1 


z- +2,0 
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Então: 


P(0 < z < +2,0) = 0,4772. 
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Portanto: 
P(13 < X x 13,20) = 0,4772 ou 47,72% 


Resposta: Ou SEJA, A PROBABILIDADE DE QUE UM SACO ESCOLHIDO ALEATORIA- 


MENTE CONTENHA ENTRE 13,00 E 13,20 Kc DE CEREAL É DE 47,72%. 


6. As alturas dos alunos de determinada escola têm uma distribuição 
normal com média de 170 centímetros e desvio padrão de 10 centíme- 
tros. QUAL A PORCENTAGEM DE ALUNOS DESSA ESCOLA COM ALTURA ENTRE 


150 CENTÍMETROS E 190 CENTÍMETROS? 
Vamos representar o gráfico para visualizar o problema. 


Figura 10 - Curva de probabilidade para exercício 6 


f(x) A 


> X (cm) 


> Z (unidades 
-3 -2 -1 OM Lu 352) "E padronizadas) 


Para X = 150, temos: 
X- 150 - 170 
S 10 


z- 


Então: 

P(-2,0 < z < 0) = 0,4772 

Portanto: 

P(150 < X < 170) = 0,4772 ou 47,72% 


Para X = 190, temos: 
X- 190 - 170 
S 10 


z- =+2,0 
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Então: 

P(0 < z < +2,0) = 0,4772 

Portanto: 

P(170 < X < 190) = 0,4772 ou 47,72% 


Como estamos interessados no intervalo de 150 a 190 centímetros, precisa- 


mos somar as duas partes (de 150 a 170 e de 170 a 190). Temos, então: 
0,4772 + 0,4772 = 0,9544 
ResrosTa: 95,4496 DOS ALUNOS TEM ALTURA ENTRE 150 E 190 CENTÍMETROS. 


7. Em um vestibular, verificou-se que os resultados tiveram uma distri- 
buição normal com média igual a 6,5 e desvio padrão igual a 1,0. Quar 


A PORCENTAGEM DE CANDIDATOS QUE TEVE MÉDIA ENTRE 4,0 E 5,0? 
Vamos ao gráfico (veja a Figura 11). 


Figura 11 - Curva de probabilidade para o exemplo nümero 10 


f(x) À 


> X (notas) 


> Z (unidades 
-3 -2 -1 0 +1 PO. Fo padronizadas) 


Para X = 4,0, temos: 


X- 4,0-6,5 
S 1 


Entào: 


P(-2,5 < z < 0) = 0,4938 
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Portanto: 
P(4,0 < X € 65) = 0,4938 ou 49,38% 


Para X = 5,0, temos: 


Então: 

P(-1,5 < z < 0) = 0,4332 

Portanto: 

P(5,0 < X < 6,5) = 0,4332 ou 43,32% 


Como estamos interessados no intervalo de notas entre 4,0 e 5,0, devemos 
subtrair as porcentagens encontradas, pois temos 49,38% das notas entre 
4,0 e 6,5 e 43,32% das notas entre 5,0 e 6,5. Logo, entre 4,0 e 5,0, temos 
(49,38% — 43,32%) = 6,06%. 


ResrosTA: ENTÃO, 6,06% DOS CANDIDATOS TIROU NOTAS ENTRE 4,0 E 5,0. 
Z 7 


A Sintese 


Diferentemente de uma variável aleatória discreta, uma variável aleatória 
contínua pode assumir qualquer valor real, inteiro ou fracionário, dentro 
de um intervalo definido de valores. Dessa maneira, para distribuições de 
probabilidade, não conseguimos enumerar todos os possíveis valores de 
uma variável aleatória contínua com os valores de probabilidades corres- 
pondentes. Em lugar disso, a abordagem mais conveniente é construir uma 
função densidade de probabilidade ou curva de probabilidade baseada na 
função matemática correspondente, COMO FOI CONSTRUÍDO NESTE CAPÍTULO 
NOS VÁRIOS EXERCÍCIOS PROPOSTOS. Isso pelo fato de que a proporção da área 
incluída entre dois pontos quaisquer, debaixo da curva de probabilidade, 
identifica a probabilidade de que a variável aleatória contínua selecionada 
assuma um valor entre tais pontos. A área total limitada pelo eixo horizon- 


tal e pela curva normal é igual a 1 (que corresponde a 100%). 
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At Questões para revisão 


Nos exercícios a seguir, assinale a alternativa correta. 


T: 


Em um teste de estatística realizado por 45 alunos, a média obtida 
foi de 5,0, com desvio padrão igual a 1,25. Determine quantos alunos 
obtiveram notas entre 5,0 e 7,0. 


( ) 24 alunos ( ) 20 alunos 

( ) 18 alunos ( ) 16 alunos 

( ) 25 alunos 

Uma fábrica de pneumáticos verificou que o desgaste dos seus pneus 
obedecia a uma distribuição normal, com média de 72.000 km e des- 


vio padrão de 3.000 km. Calcule a probabilidade de um pneu, aleato- 
riamente escolhido, durar entre 69.000 km e 75.000 km. 


() 34,13% ( ) 86,64% 

( ) 68,26% ( ) 47,72% 

( ) 43,32% 

Uma siderürgica verificou que os eixos de aco que fabricava para 
exportação tinham seus diâmetros obedecendo a uma distribuição 
normal, com média de 2 polegadas e desvio padrão de 0,1 polegada. 


Calcular a probabilidade de um eixo, aleatoriamente escolhido, ter o 
diâmetro com mais de 2,1 polegadas. 


( ) 34,13% ( ) 15,8796 
( ) 68,26% ( ) 63,4896 


() 31,74% 
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E 


Asidades de um grupo de alunos apresentou média igual a vinte anos 
e desvio padrão igual a dois anos. Determine o percentual de alunos 
desse grupo que tém idade entre dezessete e vinte e dois anos. 


( ) 77,45% ( ) 34,1396 
( ) 43,32% ( ) 68,2696 
( ) 86,64% 


Em um vestibular, verificou-se que os resultados tiveram uma distri- 
buição normal com média igual a 5,5 e desvio padrão igual a 1,0. Qual 
a porcentagem de candidatos que teve média entre 3,0 e 7,0? 


( ) 49,3896 ( ) 98,7676 

( ) 43,32% ( ) 92,7096 

( ) 86,64% 

Uma fábrica de lâmpadas de automóveis, para exportação, verificou 
que a vida útil das suas lâmpadas obedecia a uma distribuição normal, 
com média de 2.000 horas e desvio padrão de 150 horas. Calcule a 


probabilidade de uma lâmpada, escolhida aleatoriamente, durar mais 
de 2.300 horas. 


( ) 95,44% ( ) 15,8796 

( ) 47,72% ( ) 2,28% 

( ) 34,13% 

A altura média dos empregados de uma empresa de seguros aproxima-se 
de uma distribuição normal, com média de 172 cm e desvio padrão de 8 


cm. Calcule a probabilidade de um empregado dessa empresa, escolhido 


aleatoriamente, ter altura maior que 176 cm. 
( ) 19,15% ( ) 15,87% 
( ) 30,85% ( ) 38,30% 


( ) 341396 
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10. 


lã. 


12. 


Se uma amostra de 3.000 unidades de certo produto possui distribuição 
normal com média igual a 30, qual o desvio padrão dessa distribuição? 


DICA: Olhe, na página 172, Parâmetros da Distribuição Normal. 


( ) 545 ( )0,99 
( )297 ( ) 882,09 
( )001 


Os salários de uma empresa de factoring tém uma distribuigáo normal 
com média de R$ 1.800,00 e desvio padrão de R$ 180,00. Qual a proba- 
bilidade de um funcionário dessa empresa, escolhido aleatoriamente, 
ganhar menos de R$ 2.070,00? 


( ) 66876 ( ) 56,68% 

( ) 93,32% ( ) 49,38% 

( ) 43,32% 

Suponha que o diámetro médio dos parafusos produzidos por uma 
indüstria é de 0,10 polegada, com desvio padrào de 0,01 polegada. 
Um parafuso é considerado defeituoso se seu diámetro for maior que 


0,11 polegada ou menor que 0,09 polegada. Qual a porcentagem de 
parafusos defeituosos? 


( ) 15,8796 ( ) 31,7496 
( ) 34,1396 ( ) 65,8796 


( ) 68,26% 


Qual a característica de uma variável aleatória contínua? 


Defina o que é uma distribuição normal de probabilidade. 
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A distribuição qui-quadrado 


Conteúdos do capítulo 

e Conceituação de distribuição qui-quadrado 

e Cálculos para a aplicação da distribuição qui-quadrado 
Após o estudo deste capítulo, você será capaz de: 


1. definir e caracterizar a distribuição qui-quadrado; 
2. aplicar a distribuição qui-quadrado. 


A distribuição qui-quadrado, que representaremos por y?, foi estudada por 
Karl Pearson. Observar que x* é letra grega Chi (lê-se "qui"). 


Y? é uma distribuição contínua e muito utilizada em inferência estatística. 


Se temos n variáveis aleatórias independentes, representadas por 
Xy Xy Xy -= X,, com média igual a 0 (zero) e variância igual a 1 (um), então 
podemos definir uma variável aleatória com distribuição qui-quadrado à 


variável. 
Dear? 2 2 2 
=P ex^qyx?- e 


em que n é um parâmetro da função densidade denominado de liberdade. 


Simplificadamente, 
n j AY 
xXj-Ex!-X2z?,em que x7» ——— 
iji dap! 1 S 


Observar que x, é uma variável aleatória de distribuição normal reduzida. 


O grau de liberdade é normalmente representado pela letra grega q** (fi), 


È 
8 
8 
8 
8 
8 
E 
E 
E 
$ 
i 
à 
8 
$ 
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E 
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ê 
E 
E 
i 
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E 
& 
8 


sendo 0 maior ou igual a 1. 


O QUE SIGNIFICA GRAU DE LIBERDADE? 


Nenhuma parte desta 


Cada uma das variáveis aleatórias normais atua como um número que 
podemos escolher livremente; e como temos n desses números, é como se 


tivéssemos n diferentes escolhas livres!. 


* A letra grega y (qui) equivale ao ch. 


** A letra grega Ọ (fi) equivale ao f. 


Suponha uma amostra constituída por n elementos, da qual desejamos 


conhecer a variância (S?). 


IMPORTANTE RECORDAR: 
S? representa a variância de uma amostra retirada de uma população com 


variância o?. 


O primeiro passo é a determinação da média X dos n elementos. O segun- 
do passo é a determinação de S. 


IMPORTANTE SABER: 


Para a população toda, a média é representada por p e a variância por o°. 


A função qui-quadrado de densidade é 


n 
27 a 


f) - — x e 


Em que c é uma constante que assume valores tal que a área total sob a 


curva é igual a 1(um) ou 10076. 


Como x? é a soma de n variáveis aleatórias e como essas variáveis são in- 
dependentes, temos que a variância é igual à soma de todas as variâncias 
individuais. 

Então: 


X,=n, ou seja, a média de uma distribuição qui-quadrado é igual ao grau 
de liberdade. 


S?=2.n, ou seja, a variância é igual ao dobro do grau de liberdade. 


Para diferentes valores de n, temos diferentes curvas que descrevem a fun- 


ção densidade. 


Vejamos alguns exemplos na Figura 12. 
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Figura 12 - Distribuições qui-quadrado para diferentes graus de liberdade 


A área sob cada uma dessas curvas vale 1 (um) ou 100%. 


Para a determinação de um percentual de área sob a curva, devemos uti- 


lizar a tabela 36. 


Tabela 36 - Distribuição y? 


Áreas D 

ọ 10,95 [0,990 |0,975 |0,950 |0,900 |0,2750 10.500 [0,2250 |0,100 [0,050 |0,025 |0,010 |0,005 

1 [0,0000 0,0002 |0,0010 |0,0039 [0,0158 |0,1020 |0,455. 1,323 12,706 |3,841 [5,024 16,635 |7,879 

2 [0,0100 [0,020 |0,0506 |0,11030 |0,2110 10.575 1,386 |2,773 4,605 [5,991 |7,378 9,210 10,597 
3 |0,0717 |0,115 |0,216 [0,352 |0,584 |1,213 12,366 |4,108 |6,251 |7,815 |9,348 11,345 |12,838 
4 10,207 |0297 |0,484 |0711 |1064 |1,923 3,357 |5,385 |7,779 |9,488 [11,143 |13,277 |14,860 
5 |0412 |0,554 |0,831 |1145 1610 12,675 |4351 /6,626 |9,236 |11,071 |12,833 |15,086 16,750 
6 |0,676 |0,872 |1237 11,635 |2,204 |3,455 |5,348 |7,841 0,645 |12,592 [14,449 |16,812 |18,548 
7 |0,989 [1,239 |1,690 12,167 |2,833 |4,255 |6,346 |9,037 [12,017 |14,067 |16,013 |18,475 |20,278 
8 |1,344 |1,646 |2,180 |2,733 |3,490 |5,071 |7,344 |10,219 113,362 [15,507 |17,535 |20,090 |21,955 
9 |1,725 |2,088 |2,700 |3,325 |4,168 |5,899 8,343 [11,389 [14,684 |16,919 |19,023 |21,666 |23,589 
10 |2,156 |2,558 |3,247 |3,940 [4,865 [6,737 |9,342 |12,549 |15,987 |18,307 |20,483 |23,209 |25,188 
11 [2,608 |3,053 |3,816 |4,575 [5,578 |7,584 [10,341 |13,701 [17,275 |19,675 |21,920 |24,725 |26,757 
12 |3,074 |3,571 |4404 |5,226 [6,304 |8,438 [11,340 |14,845 [18,549 |21,026 |23,337 |26,217 |28,299 
13 [3,565 |4,107 |5,009 |5,892 17,042 |9,299 12,340 |15,984 [19,812 |22,362 |24,736 |27,688 |29,819 


(continua) 
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(Tabela 36 — conclusáo) 


14 |4075 |4,660 5,629 |6,571 |7,790 |10,165 |13,339 |17,117 |21,064 |23,685 |26,119 |29,141 [31,319 


15 14,601 |5,229 |62262 7,2261 [8,547 |11,037 |14,339 |18,245 |22,307 |24,996 |27,488 |30,578 [32,801 


16 [5142 |5,812 |6,908 |7,962 |9,312 |11,912 |15,338 |19,369 |23,542 |26,296 |28,845 |32,000 [34,267 


17 |5,697 |6408 |7,564 8,672 0,085 |12,792 |16,338 |20,489 24,769 |27,587 |30,191 |33,409 (35,718 


18 [6265 |7,015 |8,231 9,390 0,865 |13,675 |17,338 |21,605 |25,989 |28,869 |31,526 |34,805 37,156 


19 [6844 7,688 8,907 |10,117 |11,651 |14,562 |18,338 |22,718 |27,204 |30,144 |32,852 |36,191 [38,582 


20 |7,434 8,260 |9,591 |10,851 |12,443 |15,452 |19,337 |23,828 |28,412 |31,410 |34,170 [37,566 |39,997 


21 8,084 8,897 |10,283 |11,591 |13,2240 |16,344 |20,337 |24,935 |29,615 (32,671 |35,479 |38,932 |41,401 


22 |8,043 9,542 10,982 |12,338 |14,042 |17,240 |21,337 |26,039 |30,813 |33,924 |36,781 |40,289 |42,796 


23 |9,260 [10,196 |11,689 |13,091 |14,848 |18,137 |22,337 |27,141 |32,007 (35,172 |38,076 |41,638 |44,181 


24 |9,886 [10,856 |12,401 |13,848 |15,659 |19,037 |23,337 |28,241 |33,196 (36,415 |39,364 |42,980 |45,559 


25 |10,520 |11,524 |13,120 |14,611 |16,473 |19,939 |24,337 |29,339 |34,382 (37,652 |40,646 |44,314 |46,928 


26 |11,1160 |12,198 |13,844 |15,379 |17,2292 |20,843 |25,336 |30,435 |35,563 (38,885 |41,923 |45,642 |48,290 


27 |11,808 |12,879 |14,573 |16,1151 |18,114 |21,749 |26,336 |31,528 |36,741 |40,113 |43,194 |46,963 |49,645 


28 |12,461 |13,565 |15,308 |16,928 |18,939 |22,657 |27,336 |32,620 |37,916 |41,337 |44,461 |48,278 |50,993 


29 |13,121 |14257 |16,047 |17,708 |19,768 |23,567 |28,336 |33,711 |39,087 |42,557 |45,722 |49,588 |52,336 


30 |13,2787 |14,9954 |16,791 |18,493 |20,599 |24,478 |29,336 |34,800 |40,256 |43,773 |46,979 |50,892 |53,672 


31 |14,458 |15,655 |17,539 |192281 |21,434 |25,390 |30,336 |35,887 |41,422 |44,985 |48,232 |52,191 | 55,003 


32 |15,134 |16,362 |18,291 |20,072 |22,271 |26,304 |31,336 |36,973 |42,585 |46,194 |49,480 |53,486 | 56,328 


33 |15,815 |17,074 |19,047 |20,867 |23,110 |27,219 |32,336 |38,058 |43,745 |47,400 |50,725 |54,776 |57,648 


34 |16,501 |17,789 |19,806 |21,664 |23,952 |28,136 |33,336 |39,141 |44,903 |48,602 |51,966 |56,061 |58,964 


35 |17,192 |18,509 |20,569 |22,465 |24,797 |29,054 |34,336 |40,223 |46,059 |49,802 |53,203 |57,342 |60,275 


36 |17,887 |19,233 |21,336 |23,269 |25,643 |29,973 |35,336 |41,304 |47,212 |50,998 |54,437 |58,619 161,581 


37 |18,586 |19,960 |22,106 |24,075 |26,492 |30,893 |36,336 |42,383 |48,363 |52,192 |55,668 |59,892 | 62,883 


38 |19,289 |20,691 |22,878 |24,884 |27,343 |31,815 |37,335 |43,462 |49,513 |53,384 |56,896 |61,162 164,181 


39 |19,996 |21,426 |23,654 |25,695 |28,196 |32,737 |38,835 |44,539 |50,660 |54,572 |58,120 |62,428 | 65,476 


40 [20,707 |22,164 |24,433 |26,509 |29,051 |33,660 |39,335 |45,616 [51,805 |55,758 |59,342 163,691 |66,766 


41 |21,421 |22,906 |25,215 |27,326 |29,907 |34,585 |40,335 |46,692 |52,949 |56,942 |60,561 | 64,950 [68,053 


42 [22,138 |23,650 |25,999 28,144 |30,765 |35,510 |41,335 |47,766 |54,090 |58,124 |61,777 |66,206 |69,336 


43 [22,859 |24,398 |26,785 |28,965 |31,625 |36,436 |42,335 |48,840 |55,230 |59,304 |62,990 167,459 |70,616 


44 [23,584 |25,148 |27,575 29,787 |32,487 |37,363 |43,335 |49,913 [56,369 |60,481 |64,201 |68,710 |71,893 


45 |24,311 |25,901 28,366 |30,612 |33,350 |38,291 44,335 |50,985 |57,505 |61,656 165,410 [69,957 |73,166 


50 (27,991 |29,707 |32,357 |34,764 (37,689 |42,942 |49,335 |56,334 163,167 [67,505 |71,420 | 76,154 |79,490 


60 |35,534 |37,485 |40,482 |43,188 |46,459 |52,294 | 59,335 |66,981 |74,397 |79,082 |83,298 |88,379 |91,952 


70 |43,275 |45,442 |48,758 |51,739 |55,329 (91,698 | 69,335 |77,577 |85,527 |90,531 |95,023 |100,43 |104,26 


80 |51,172 |53,540 |57,153 160,391 |34,278 |71,145 |79,335 | 88,130 |96,578 |101,88 |106,63 |112,33 |116,32 


90 |59,196 161,754 165,647 |69,126 |73,291 (80,625 | 89,335 |98,650 |107,57 113,15 |118,14 |124,12 |128,30 


100167,328 |70,065 |74,2222 |77,929 |82,358 |90,133 |99,335 |109,14 |118,50 [124,34 |129,56 1135,81 |140,17 
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Para q > 30, devemos utilizar a aproximação: 
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TL. 7 Exercício Resolvido 


Desejamos calcular o valor de k tal que p(x? > k) = 0,100 com n = 16 graus 
de liberdade. 


Consultando a Tabela 36, para p = 0,100 e para q = 16, temos k = 23,542. 


Graficamente, temos: 


n=16 


1-p 1096 


» 
0 23,542 x 


Ao tracarmos um gráfico de y? em função das porcentagens acumuladas 


rais é crime estabelecido na Lei nº 9610/1998 e punido pelo art. 184 do Código Penal. 


com que os valores foram encontrados, supondo grau de liberdade igual 


a 2, obteríamos uma distribuição como a representada na Figura 13. 


Figura 13 - Distribuição qui-quadrado para grau de liberdade = 2 


0 1 2 3 4/5 6 x 
4,605 
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Vamos analisar a área delimitada pelos valores de y? entre 4,605 e 9,210. 


A área total sob a curva é igual a 100%. Então, o valor 4,605 delimita 10% 
dessa área e o valor 9,210 delimita 1% da mesma. 


Então, esperamos que 90% dos resultados forneçam valores de y? menores 
que 4,605 e que 99% dos resultados forneçam valores de y? menores que 
9,210. 
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RESPOSTA: Logo, VALORES DE X? IGUAIS OU MAIORES QUE 9,210 TÊM PROBABILI- 


DADE DE OCORRÊNCIA IGUAL A 1%. 


IMPORTANTE SABER: 

Observa-se pelas curvas que, quando o grau de liberdade é pequeno, a 
função de densidade é bem assimétrica e ela vai se tornando simétrica 
na medida em que esse grau vai aumentando. Quando n é muito grande, 


a distribuição qui-quadrado se assemelha a uma distribuição normal. 


A Sintese 


A distribuição qui-quadrática, como vimos, é uma distribuição contínua 


e muito utilizada em inferência estatística. E, se você observar no exer- 


cício realizado neste capítulo, verá que é possível analisar pelas curvas 


que, quando o grau de liberdade é pequeno, a função de densidade é bem 


assimétrica e ela vai se tornando simétrica à medida que esse grau vai 


aumentando. Quando n (parâmetro da função densidade, denominada de 


liberdade) é muito grande, a distribuição qui-quadrado se assemelha a uma 


distribuição normal. Portanto, o que distingue a distribuição qui-quadrá- 
tica é o grau de liberdade. 


71 Questões para revisão 


1. 


Dada a distribuição qui-quadrado com n = 12 graus de liberdade, cal- 


cule a média, a variância e o desvio padrão. 

Calcule k para que p(x? > k) = 0,75 com n = 18 graus de liberdade. 
Calcule p(9,591 < 3? < 34,170), com n = 20 graus de liberdade. 
Calcule k para que p(x? > k) = 0,75, com n = 13 graus de liberdade. 
Calcule k para que p(x? > k) = 0,10 com n = 44 graus de liberdade. 
Assinale a alternativa correta. 

a. A distribuição qui-quadrado é representada por y?. 


b. A distribuição qui-quadrado foi estudada por Pearson. 


195 


Nenhuma parle desta publicação poderá ser reproduzida por qualquer meio ou forma sem a prévia autorização da Editora Ibpex. A violação dos direitos autorais é crime estabelecido na Lei nº 9610/1998 e punido pelo art. 184 do Código Penal. 


196 


C. A distribuição qui-quadrado é uma distribuição discreta. 
d. A distribuição qui-quadrado não serve para o uso estatístico. 
Assinale a alternativa correta. 


a. Representamos por y? a distribuição qui-quadrática, sendo ela 
uma distribuição contínua muito utilizada nas equações lineares. 


b. Grau de liberdade em distribuição qui-quadrática caracteriza- 
se pelo fato de cada uma das variáveis aleatórias normais atuar 


como um número que podemos escolher livremente. 


c. Na distribuição qui-quadrática, para a população toda, a média é 


representada por o e a variância por S?. 


d. S? representa a variância de uma amostra retirada de uma popu- 


lação com variância o. 
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Inferéncia es 


Conteúdos do capítulo 


e Conceituação de inferência estatística 

e  O processo de amostragem 

e  O processo de estimação 

e O fator “confiança” na estatística: intervalo, nível e aplicação 


Após o estudo deste capítulo, você será capaz de: 


1. definir inferência estatística, amostragem, estimação e intervalo de 
confiança; 
2. aplicar o intervalo de confiança em situações concretas. 


Inferência estatística 


Para realizarmos a INFERÊNCIA ESTATÍSTICA, devemos trabalhar com conhe- 
cimentos que envolvem amostragem, estimação e intervalo de confiança. 
Nesse processo, precisamos prestar atenção na classificação e técnicas de 
seleção, pois encontramos levantamentos amostrais probabilísticos e não 
probabilísticos, e decidirmos pelos tipos de estimativas, como veremos em 
detalhes na sequência. 


Amostragem 


Para a seleção de uma amostra que seja representativa de certa popula- 
ção, é necessário conhecer as técnicas utilizadas para essa seleção. Para a 
obtenção dos dados amostrais, os levantamentos podem ser totalmente 
controlados pelo pesquisador. 


Tais levantamentos podem ser assim classificados: 
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( Simples 
- , 2 
"m Amostragem Sistemática 
Probabilísticos s a 
aleatória Estratificada 
Por conglomerados 
Levantamentos x 
amostrais 


(C " 
Intencional 


S E Amost pas 
Não probabilísticos DO TAS 2 Voluntária 
não aleatória 
| Acidental 


U 


Amostragem aleatória simples 


É a forma mais fácil de se selecionar uma amostra probabilística. Todos os 
elementos da população têm igual probabilidade de serem selecionados. 


Normalmente, atribuímos a cada elemento um número e selecionamos os 


números até que tenhamos os n elementos desejados da amostra. 


Amostragem aleatória sistemática 


E uma variação da amostragem aleatória simples e muito utilizada em 


pesquisas de opinião. Por exemplo, serão selecionados como amostra os 


rt. 184 do Código Penal. 


alunos de uma universidade cujo nome inicie com as letras de C até J. O 


intervalo de amostragem de n elementos é obtido por N/n, em que N éo 
tamanho da população. 


Amostragem aleatória estratificada 


Imaginemos uma população heterogênea, constituída por todos os fun- 
cionários de uma grande indústria. Vamos dividir esses funcionários em 
grupos homogêneos, em função do salário dos mesmos. Cada um desses 
grupos homogêneos denominamos de estrato. 


E 
É 


Após a identificação dos estratos, fazemos a amostragem aleatória simples 
de cada estrato. 


Amostragem aleatória por conglomerados 


Desejamos saber a escolaridade dos moradores de um bairro de determi- 
nada metrópole brasileira. Dividimos, em um mapa, esse bairro em peque- 
nas áreas. Fazemos uma amostragem aleatória simples dessas pequenas 
áreas e, nas mesmas, entrevistamos todos os seus moradores para conhe- 


cermos suas escolaridades. 


Amostragem não aleatória intencional 


A amostra é selecionada intencionalmente pelo pesquisador. Por exemplo, 
o pesquisador entrevista os usuários de uma biblioteca quanto ao seu esti- 
lo preferido de leitura. 
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Amostragem náo aleatória voluntária 


Nesse caso, os elementos da população se oferecem voluntariamente para 


fazer parte da amostra sem a interferéncia do pesquisador. 


Amostragem náo aleatória acidental 


Nesse caso, os elementos da população são escolhidos na medida em que 


aparecem, ou seja, são acidentalmente selecionados. 


Estimação 


rt. 184 do Código Penal. 


Um dos grandes problemas da estatística é a ESTIMATIVA DAS PROPRIEDADES 


DAS POPULAÇÕES. 


Nos capítulos 8, 9 e 10 estudamos as distribuições de probabilidades bino- 
mial, de Poisson e normal, respectivamente. Nos exemplos que analisamos, 
conhecíamos todas as probabilidades envolvidas e consideramos as pro- 
priedades daquelas distribuicóes. 


Na distribuição binomial, por exemplo, a fórmula, apresentada no capítulo 
8, permite-nos calcular a probabilidade de um evento acontecer se conhece- 


E 
É 


mos a probabilidade p de sucesso e o valor N de tentativas. Os valores que 
forem atribuídos a esses dois parâmetros determinam a distribuição bino- 
mial em questão. Como normalmente determinamos o valor de N, nossos 
problemas de estimativas para as distribuições binomiais reduzem-se a esti- 
mar p. Na distribuição de Poisson, o problema é semelhante. 


Na distribuição normal, podemos realizar qualquer cálculo se conhecermos 
a média (4) e o desvio padrão (S). Então, nossos problemas de estimativas 
para as distribuições normais se reduzem a estimar À e S. 


Imaginemos uma amostra de 1.000 pessoas, todas eleitores. A cada pessoa 
dessa amostra perguntaremos se está satisfeita com o governo atual. A res- 


posta à pergunta poderá ser SIM (satisfeita) ou NÃO (insatisfeita). Deseja- 
mos, nesse caso, estimar a proporção de pessoas que estão satisfeitas com 
o governo atual. 


Suponhamos que 700 pessoas dessa amostra respondam SIM. Isso nos dá 
a estimativa natural para essa proporção, que é igual a 700/1.000, ou seja, 
0,70 ou 70%. Evidentemente, estamos supondo que essa amostra representa 
perfeitamente a população em questão. A essa grandeza denominamos de 
ESTIMADOR. 
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Estimador é uma grandeza baseada em observações feitas em uma 
amostra e que é considerada como indicador de um parâmetro popu- 
lacional desconhecido. 


A inferência estatística preocupa-se em conhecer as propriedades desses 
estimadores. 


Uma estimativa é o valor atribuído ao estimador. 
No exemplo anterior, uma estimativa de p (representaremos por E(p)) é: 


E(p) = 0,7 ou 70%. 


Estimativa por ponto e por intervalo 


A estimativa de parâmetros na estatística pode ser por ponto ou por intervalo. 


À ESTIMATIVA POR PONTO é um valor obtido a partir de cálculos efetuados 
com os dados da amostra, que serve como uma aproximação do parâme- 
tro estimado. 


Assim, um estimador que apresenta um único valor, como no exemplo 


anterior, é um estimador pontual. 

Da mesma forma, se temos n elementos em uma amostra, a média amostral 
X2 (X, * X, +... * X)/n 

é usada como estimador da média populacional desconhecida. 


Por exemplo, se a amostra observada é constituída pelos números 3, 4, 6, 6, 
8e9, então X 6 é uma estimativa da média populacional. Esse é, também, 
um estimador pontual. 
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À ESTIMATIVA POR INTERVALO para um parâmetro é uma faixa de valores 


possíveis e aceitos como verdadeiros, dentro da qual se estima que se en- 


Nenhuma parte desta 


contre o parâmetro. A estimativa por intervalo apresenta uma maior van- 
tagem em relação à estimativa por ponto, pois ela nos permite diminuir a 
magnitude do erro que estamos cometendo. Quanto menor o comprimen- 


to do intervalo, maior a precisão dos nossos cálculos. 


As estimativas por intervalo são denominadas de INTERVALOS DE CONFIANÇA. 
Esses intervalos são baseados na distribuição amostral do estimador pontual. 
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Intervalo de confiança 


Um intervalo de confiança é um intervalo de valores obtidos a partir de 
observações de uma amostra e determinado de tal maneira que haja uma 
probabilidade de esse intervalo conter o valor desconhecido de um parâme- 
tro que desejamos determinar. Em geral, calculamos intervalos de confiança 


que tenham uma chance de 95% de conter o verdadeiro valor.! 


Nível de confiança 


O nível de confiança é um número que exprime o grau de confiança (ou 


porcentagem) associado a um intervalo de confiança. 


IMPORTANTE: a partir de agora, chamaremos de X a média de uma amos- 
tra de tamanho n e chamaremos de u (mu) a média de uma população qual- 


quer. Lembre que u não é uma variável aleatória, e, sim, um parâmetro. 


A partir de agora, também, chamaremos de o* o desvio padrão de uma 
população e de S o desvio padrão da amostra. 


Normalmente, X está no meio do intervalo de confiança. Assim, podemos 
dizer que o verdadeiro valor de u está próximo ao valor de X. Só não sabe- 
mos quão próximo. Se considerarmos que o intervalo que contém p tem 
comprimento igual a 2 . c, precisamos determinar a probabilidade de u estar 
entre (X - c) e (X + c). Verifique, na representação a seguir, o comprimento 
do intervalo de confiança: 


intervalo 


X 


Para um valor muito grande de c, temos certeza de que q se encontra nesse 
intervalo. No entanto, um intervalo muito grande não tem aplicação práti- 
ca, portanto, quanto menor o valor de c, mais preciso será o valor de u. Há, 
entretanto, no caso de c pequeno, a possibilidade de que u não se encontre 
no intervalo entre (X - c) e (X + c). Como já dito anteriormente, é comum 


escolhermos a probabilidade igual a 95% de p estar nesse intervalo. 


Então, nossos cálculos devem determinar a amplitude do intervalo para 
que haja 95% de chance de ele conter u. Trata-se de um intervalo de con- 
fiança com nível de confiança igual a 95%. 
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Queremos, portanto, construir um intervalo de confiança (IC) da forma 
Xtc. 


2 "A 


Segundo Fonseca e Martins?, "c" é o erro amostral, expresso na unidade da 
variável. O erro amostral é a máxima diferença que o investigador admite 


suportar entre y e X. 

Devemos, então, determinar o valor de c que verifique a equação: 
P(X-c<u<X+c)=0,95 

Em que: 


O 


o 
LU 
N 


para populações infinitas, 
n 


sendo que z tem distribuição normal padronizada (média igual a zero e 


desvio padrão igual a 1, ver capítulo n? 10) e n é o tamanho da amostra (n > 30). 


Logo, para determinarmos o tamanho de uma amostra quando a população 
é infinita, temos que: 


em que: 


z = abscissa da distribuição normal padronizada para determinado nível 
de confiança; por exemplo, para nível de confiança igual a 98%, z = 2,33 
(ver tabela 35 no capítulo 10) 

o = desvio padrão da população 

c=erro de estimativa ou erro de amostragem; é a máxima diferença que o 
pesquisador admite entre X eu 


n= tamanho da amostra aleatória simples 


Observe que consideramos conhecer o valor de o. Caso não conheçamos 
esse valor, determinamos a média (X) e o desvio padrão (S) de uma amos- 


tra aleatória e fazemos esses mesmos cálculos utilizando S no lugar de o. 


No nosso exemplo, em que estamos supondo 95% de nível de confiança 
(em outras palavras, 5% de probabilidade de erro de estimação), z vale 
(ver tabela 35 no capítulo 10): 
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9576 0,95 
S = ; = 0,4750, que corresponde a z = 1,96 


Por que dividimos 9576 por 2? 


Lembre-se de que a Tabela 35 do capítulo 10 só mostra metade da área sob 


a curva normal. Por isso, fizemos a divisão por 2. 
Para populações finitas, temos que: 


z-o- N 


C(N-1)+22.6º 


Em que N é o tamanho da população. 


Temos na TEORIA DA AMOSTRAGEM um teorema que diz: se a variável X possui 

uma distribuição normal com média u e com desvio padrão o, então a 

média X, da amostra de tamanho n, também terá uma distribuição normal 
[o] 


com média igual a u e com desvio padrão dado por S = 
n 

Observar que a população é infinita ou a amostragem é com reposição. Caso 

a população seja finita ou a amostragem seja sem reposição, temos que: 


0 
: N-n 


NB N-1 


S= 


Exemplos de aplicação de intervalos de confiança 


Vamos determinar o intervalo de confiança para as pessoas de uma locali- 
dade, as quais possuem, em uma amostra de 40 pessoas, peso médio de 60 
kg com desvio padrão de 3 kg. Supor nível de confiança igual a 95%. 


Queremos determinar P (X - c < u < X + c) = 0,95. 
Já vimos anteriormente que, para 95% de confiança, z = 1,96. 


Então: 
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c=z 
VS 
c=1,96 
N 40 
c=0,93 
Logo: 


P (60 - 0,93 < u < 60 + 0,93) = 0,95 

O intervalo de confiança é: 

IC (59,07 < u < 60,93) = 95% 

Isso SIGNIFICA QUE HÁ 95% DE CHANCE DE U ESTAR ENTRE 59,07 KG E 60,93 KG. 


AGORA, VAMOS RESOLVER ESSE EXEMPLO, SUPONDO NÍVEL DE CONFIANÇA IGUAL A 
99%. 


Queremos determinar P (X - c < u < X + c) = 0,99. 


Vamos calcular z: 


99% 0,99 
2 - = 0,4950, que corresponde a z = 2,58 
Entào 
o 
c=z 


c=1,22 
P (60 - 1,22 < u < 60 + 1,22) = 0,99 
O intervalo de confiança é: 


IC (58,78 < p < 61,22) = 99% 
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Isso SIGNIFICA QUE HÁ 99% DE CHANCE DE U ESTAR ENTRE 58,78 KG E 61,22 KG. 


Observe que, quando aumentamos o nível de confiança para 99%, o intervalo 
de confiança ficou maior. 


TU "Exercícios Resolvidos 


1. Determinar o intervalo de confiança para as pessoas de uma localidade, 
as quais possuem altura média de 168 centímetros, com desvio padrão 
de 20 centímetros. Supor uma amostra de 272 pessoas e nível de confian- 
ça igual a 90%. 


Queremos determinar P (X - c < u < X + c) = 0,90. 


INICIALMENTE, VAMOS DETERMINAR O VALOR DE Z. 


rais é crime estabelecido na Lei nº 9610/1998 e punido pelo art. 184 do Código Penal. 


P (168 — 2 < p < 168 + 2) = 0,90 
O INTERVALO DE CONFIANÇA É: 


IC (166 < u < 170) = 90% 


90% 0,90 

7 = 7 = 0,45, que corresponde a z = 1,65 
Como: E 
C-Z É 
qn ; 
Temos que: i 
20 E 
c-1,665. = S $ 
272 : 
c-20 H 
i 


Isso SIGNIFICA QUE HÁ 90% DE CHANCE DE | ESTAR ENTRE 166 CM E 170 cm. 


2. Um exportador de papel higiênico está preocupado com a metragem 
do seu produto. Sabemos que tal metragem tem uma distribuição 
aproximadamente normal, com desvio padrão de 1 metro (o = 1). Va- 


mos fazer um teste em um lote de 100 rolos de papel higiênico, cuja 
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média é de 50 metros por rolo (X = 50). DETERMINE O INTERVALO DE 


CONFIANÇA PARA UM NÍVEL DE CONFIANÇA IGUAL A 95,44%. 


Sabemos que: 


o 


NE: 


Então, temos: 


100 
S=0,1 metros 


Recordando a curva de distribuição normal, estudada no capítulo 10, temos 
que: 


f(x) À 


—— + E 


497 49,8 499 50 DUM WESU,2 [50,3 


» X (metros) 


» Z (unidades 
-3 -2 -1 0 *1 +2 «3 padronizadas) 


e supondo-se um nível de confiança igual a 95,44% (z = 2, como visto ante- 
riormente na tabela 35), há 95,44% de chance de que a variável normal assu- 
ma um valor entre u - 0,2 e u + 0,2, pois c =2 . 0,1 ou seja c = 02. 


No nosso exercício, X = 50 (média da amostra). Então, esse valor só diverge 
do valor de u (média da população) em mais de 0,2 metros para 4,56% da 
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produção de papel higiênico, pois em 95,44% das amostras o exportador en- 


contra uma divergência máxima no valor de u igual a 0,2 metros. 
RESPOSTA: O INTERVALO DE CONFIANÇA É IC (49,8 < u < 50,2) = 95,44% 


UM NOVO CONCEITO PARA VOCÊ: a diferença X — u é denominada 
ERRO DE ESTIMATIVA OU ERRO DE AMOSTRAGEM. Mas como saber o erro exato 
se um cálculo de estimativa só é feito quando p é desconhecido? É por 
isso que, para o cálculo de um erro de estimativa, devemos utilizar a teo- 


ria das probabilidades apresentada no capítulo 7. 


3. Considerando-se o exercício 2, QUAL O TAMANHO DA AMOSTRA QUE SE 
DEVE TER PARA QUE, COM UMA PROBABILIDADE DE 98%, SUA ESTIMATIVA 


NÃO ESTEJA ERRADA EM MAIS DE 0,15 METROS? 
Para 98%, temos z = 2,33 (ver tabela 35 do capítulo 10). 


Então, o valor den (nossa amostra) deve ser tal que 2,33 desvios padrão para 
X seja igual a 0,15. Em outras palavras: 


2,33 -.S=0,15 
Como S = ec-1 
n 
temos: 
2,33. =0,15 
n 


2,33 
Vn =——— = 15,533 
(15 
n = 15,533? 
RESPOSTA: N = 241 ROLOS DE PAPEL HIGIÊNICO 


4. Suponhamos que, no exercício anterior, estivéssemos preocupados 
com um nível de confiança de apenas 70%. Nesse caso, qual é o tama- 
nho da amostra? 


70% corresponde a um z = 1,04. 


Temos, então: 
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1,04. 


104 V 
n m 
0,15 


RESPOSTA: N = 48 ROLOS DE PAPEL HIGIÊNICO. 


5. Considerando ainda o mesmo exercício, QUAL O INTERVALO DE CON- 
FIANÇA PARA NÍVEL DE CONFIANÇA IGUAL A 97% E UMA AMOSTRA DE 100 


ROLOS DE PAPEL? 


Para nível de confiança igual a 97%, o valor de z é 2,17 (ver tabela 35). 


o 


NE 


Como a população é infinita, c = z . 


c=2,17. 
100 


c=0,217 

P (50 - 0,217 < u < 50 + 0217) = 0,97 
O intervalo de confiança é: 

IC (49,783 < u < 50,217) = 97% 


RESPOSTA: ISSO SIGNIFICA QUE HÁ 97% DE CHANCE DE L ESTAR ENTRE 49,783 m E 
50,217 m. 


6. Os dados a seguir relacionam-se ao consumo de energia de cem resi- 
déncias em um bairro de baixa renda de Curitiba, em kWh (quilowatts 
hora). 


45 55 48 56 70 66 88 58 46 55 
76 41 67 84 40 59 67 82 53 90 
53 86 74 75 43 58 91 83 76 50 
44 70 85 49 51 43 76 77 85 57 
67 69 75 46 47 58 60 64 80 49 


61 66 90 87 45 46 88 74 56 50 
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44 75 78 93 45 82 81 41 55 58 
60 60 53 78 64 49 63 71 70 44 
77 54 69 72 90 73 57 50 55 60 
51 88 85 45 66 78 46 54 57 59 


JÁ CALCULAMOS PARA VOCÊ A MÉDIA E O DESVIO PADRÃO DESSA POPULAÇÃO, QUE 


SÃO OS VALORES: 
n7 64 
o = 14,82 


Agora retire uma amostra contendo três linhas (30 elementos) quaisquer e 
MONTE UMA DISTRIBUIÇÃO DE FREQUÊNCIAS. À seguir, CALCULE A MÉDIA e O DES- 
VIO PADRÃO DESSA AMOSTRA. Finalmente, DETERMINE O INTERVALO DE CONFIAN- 


ÇA PARA 97% DE NÍVEL DE CONFIANÇA. 


Para que todos cheguem ao mesmo resultado, sugerimos que escolham as 
três primeiras linhas dos dados, ou seja: 


45 55 48 56 70 66 88 58 46 55 
76 41 67 84 40 59 67 82 53 90 


53 86 74 75 43 58 91 83 76 50 
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Vamos, então, MONTAR A DISTRIBUIÇÃO DE FREQUÊNCIAS (uma tabela). 


Dados 


40 
41 
43 
45 
46 
48 
50 
53 
55 
56 
58 
59 
66 
67 
70 
74 
75 
76 
82 
83 
84 
86 
88 
90 
91 
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KA KA KA BH HH M aA KA H MH HN HIN MN dH KA HH dH KA Ka 


Q 
e] 


A MÉDIA DA AMOSTRA É: 


- 1935 
X2 ——— =645 
30 


Para nível de confiança de 97% temos: 
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97% 0,97 
3 = 0,485 que corresponde a z = 2,17 
Como: 
o 
c-z 


211 


212 


14,82 


N39 


c=2,87. 


c=5,87 
P(64,5-5,87<u<64,5+5,87)=0,97 
O INTERVALO DE CONFIANÇA É: 

IC (58,63 < u < 70,37) = 97% 


RESPOSTA: Isso SIGNIFICA QUE HÁ 97% DE CHANCE DE M ESTAR ENTRE 58,63 kWh 
E 70,37 kWh. 


7. CALCULE O INTERVALO DE CONFIANÇA NO EXERCÍCIO ANTERIOR, PARA NÍVEL 


DE CONFIANÇA IGUAL A 85%. 


85% 0,85 
pose 0,425, que corresponde a z = 1,44 
Como: 
o 
c-z 
N n 

Temos que: 

14,82 
c=1,44. 

N 30 
c=3,9 


P (64,5 - 3,9 < u < 64,5 + 3,9) = 0,85 
O INTERVALO DE CONFIANÇA É: 
IC (60,6 < u < 68,4) = 85% 


RESPOSTA: Isso SIGNIFICA QUE HÁ 85% DE CHANCE DE M ESTAR ENTRE 60,6 kWh 
E 68,4 kWh. 


8. Justifique o fato de no exercício 6 o intervalo de confiança ser maior 


que o intervalo do exercício 7. 


No exercício 6, exigiu-se um nível de confiança de 97% contra apenas 85% 
no exercício 7. Em função disso, o intervalo no 6 é maior para aumentar a 


chance de u encontrar-se dentro do mesmo. 
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A Sintese 


A INFERÉNCIA ESTATÍSTICA implica admitirmos que os resultados obtidos na 
análise dos dados de uma amostra são válidos para toda a população da 
qual aquela amostra foi retirada. Consiste em obtermos e generalizarmos 
conclusões sobre dada característica de uma população a partir de infor- 
mações colhidas da amostra. Já havíamos estudado esses conceitos no ca- 
pítulo 1 e voltamos a eles para fazermos uma sequência de construção de 
conhecimentos que nos permitissem aplicarmos em situações de elabora- 


ções estatísticas os processos e concepções de: 
e Amostragem 
e Tamanho de uma amostra 


e Estimação 
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e Estimativa por ponto e por intervalo 


e Intervalo de confiança 
e Nível de confiança 


Procedimentos esses que concluímos com exemplos de aplicação de inter- 


valos de confiança. 


A Questões para revisão 


Assinale a alternativa correta nos exercícios a seguir. 


1. Determine o intervalo de confiança para as pessoas de uma localidade 
onde os habitantes possuem peso médio de 68 kg com desvio padrão de 
3 kg. Supor nível de confiança igual a 90% e uma amostra de 64 pessoas. 
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( ) IC (67,38 < u < 68,62) = 90% 
( IC (67,92 < u < 68,08) = 90% 
( IC (63,05 < u < 72,95) = 90% 
( ) IC (63,60 < u < 72,40) = 90% 
( IC (66,35 < u < 69,65) = 90% 
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2. 


Determine o intervalo de confiança para as pessoas de uma localidade 
onde os habitantes possuem altura média de 162 centímetros, com des- 
vio padrão de 18 centímetros. Supor uma amostra de 138 pessoas e nível 
de confiança igual a 95%. 


( ) IC (158 < u < 171) = 9596 

( ) IC (126772 < u < 197,28) = 95% 

( ) IC (156 < u < 168) = 9596 

( ) IC (144 < u < 180) = 9596 

( ) IC (159 < u < 165) = 9596 

Considere os dados sobre o consumo de energia do exercício resolvi- 


do 6. Em seguida, considere a amostra constituída pelas trés ültimas 
linhas (30 elementos), ou seja: 


60 60 53 78 64 49 63 71 70 44 
77 54 69 72 90 73 57 50 55 60 
51 88 85 45 66 78 46 54 57 59 
Determine o intervalo de confiança para 99% de nível de confiança. 


Lembre-se que conhecemos a média e o desvio padrão dessa popula- 
ção. Os valores são: 


u=64e o = 14,82. Calcule o valor de "c" com duas casas após a vírgula. 
() IC (56,29 < u < 70,25) = 99% 
() IC (61,72 < u < 66,88) = 99% 
( ) IC (62,39 < u < 66,21) = 99% 
( ) IC (50,70 < u < 77,90) = 99% 


( ) IC (57,80 < u < 70,80) = 99% 
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4. 


6. 


7. 


No exercício 3, qual seria o intervalo de confiança para um nível de 
confiança de 75,80%? 


( ) IC (57,80 < u < 70,80) = 75,80% 
( ) IC (46,96 < u < 81,64) = 75,8096 
( ) IC (62,39 < u < 66,21) = 75,8096 
( ) IC (60,10 < u < 66,44) = 75,8096 
( ) IC (50,70 < u < 77,90) = 75,80% 
Determine o intervalo de confianga para os empregados de uma em- 
presa que possuem salário médio de R$ 1.840,00 com desvio padrão 


de R$ 300,00. Supor nível de confiança igual a 95% e uma amostra de 
96 empregados. 


() IC (1540 < u < 2140) = 95% 

( )IC (1252 < u < 2428) = 95% 

( ) IC (1780 < u < 1900) = 9596 

( ) IC (1600 < u < 2080) = 9596 

( ) IC (1744 < u < 1936) = 95% 

De acordo com o que vimos aqui, como vocé define o processo de 
inferéncia estatística? 


O que é um intervalo de confiança? 
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Teste de hipóteses 


Conteúdos do capítulo 


e Conceituação de teste de hipóteses 

e Os tipos de hipóteses e etapas de um teste de hipóteses 

e  Osníveis de significância e as regiões de rejeição e aceitação das hipó- 
teses. 


Após o estudo deste capítulo, vocé será capaz de: 


1. definir teste de hipóteses e seus fatores; 
2. aplicar teste de hipóteses. 


Teste de hipóteses 


O QUE É TESTE DE HIPÓTESES? 
E uma técnica para se fazer inferéncia estatística.! 


Isso significa dizer que, a partir de um teste realizado com os dados de uma 
amostra, pode-se inferir sobre a população a que essa amostra pertence. 


Lembre-se que, quando desejamos avaliar um parâmetro populacional sobre 
o qual não temos qualquer informação do seu valor, temos que o estimar por 
intermédio do INTERVALO DE CONFIANÇA. Mas, se conhecemos o valor desse 
parâmetro que desejamos avaliar, podemos testá-lo para verificar se é verda- 
deiro ou falso. 


UMA HIPÓTESE ESTATÍSTICA É, PORTANTO, UMA SUPOSIÇÃO QUANTO AO VALOR 


DE UM PARÂMETRO POPULACIONAL. O teste de hipóteses é uma técnica que 


È 
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nos permite aceitar ou rejeitar a hipótese estatística, a partir dos dados da 


amostra dessa população. 


Nenhuma parte desta 


VAMOS INICIAR NOSSA ANÁLISE A PARTIR DE UMA MOEDA. 


Ao jogarmos uma moeda, admitimos que a mesma é honesta (ou equilibrada), 
isto é, em qualquer jogada há igual probabilidade de obtermos cara (50%) 
ou de obtermos coroa (50%). 


MAs COMO PODEMOS TER CERTEZA DE QUE A MOEDA É REALMENTE HONESTA OU 
EQUILIBRADA? Suponhamos que, ao jogar uma moeda, desejamos obter o 
resultado “cara”. 


Façamos inicialmente uma constatação óbvia: se a moeda tem duas caras, 
então p = 1; se a moeda tem duas coroas, então p = 0. Continua difícil afirmar 
que a moeda é honesta ou equilibrada. Nào basta olhar para a moeda e a 
jogarmos apenas uma vez: é impossível afirmar que ela é ou nào honesta ou 
equilibrada. Faz-se necessário jogá-la um grande nümero de vezes e obser- 
var os resultados para termos alguma base de julgamento. 


Hipótese nula e hipótese alternativa 


Hipótese NULA (H,) é a informação (a hipótese) que será testada. É a infor- 


mação a respeito do valor do parâmetro que desejamos avaliar.? 


HirórESE ALTERNATIVA (H ) é a hipótese que afirma que a hipótese nula é falsa. 
E a afirmação a respeito do valor do parâmetro que aceitaremos como verda- 


deiro, caso a hipótese nula seja rejeitada. 


Observe que a hipótese nula é uma igualdade, enquanto a hipótese alter- 


nativa é uma desigualdade. 
Por exemplo: 
a) H:u=70kg 


H:u>70 kg; 


1 


b) H;u=70kg 


0 


H:u<70 kg; 


1 


o) H;u=70kg 


0 
H: u #70 kg. 


Continuemos a análise da nossa moeda, para melhorarmos o entendimento 


de hipótese nula e de hipótese alternativa. 


Primeiro, decidimos quanto à hipótese a ser testada. No caso da moeda (ante- 
riormente comentada), a hipótese é que p = 0,5. A hipótese que será testada, 
como já dissemos, é denominada de hipótese nula e a hipótese que afirma 
que a hipótese nula é falsa é denominada de hipótese alternativa. 


No nosso exemplo, a hipótese alternativa é que a moeda não seja honesta 
ou equilibrada (p x 0,5). 
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Como só temos duas possibilidades, sabemos que ou a hipótese nula ou a 
hipótese alternativa é verdadeira. Nosso problema consiste em aceitar a hi- 
pótese nula e dizer que a moeda é honesta ou equilibrada ou rejeitar a hipó- 


tese nula e afirmar que a moeda não é honesta ou equilibrada. O quE FAZER? 


Intuitivamente sabemos que devemos jogar a moeda um grande nümero de 
vezes (vamos supor n vezes) e verificar os resultados obtidos (cara ou coroa). 
Caso o nümero de caras esteja próximo a n/2, aceitamos a hipótese de que 
a moeda é honesta ou equilibrada. Caso contrário (número de caras muito 
diferente de n/2), rejeitamos tal hipótese. Aí, vem a pergunta: quão diferente 
de n/2 o resultado deve ser para que possamos aceitar ou rejeitar a hipótese 
de que a moeda é honesta ou equilibrada? 


Como dissemos anteriormente, o teste de hipóteses é uma técnica que nos 
permite aceitar ou rejeitar a hipótese estatística, a partir dos dados da amos- 
tra dessa população. Logo, usaremos uma amostra da população em estudo, 
para verificar se ela confirma ou não o valor do parâmetro informado pela 
hipótese nula. Entretanto, pela aceitação ou não de uma hipótese nula, po- 
demos cometer erros na decisão. 


VOLTEMOS À NOSSA MOEDA. 


Do 


Nosso processo de teste é o seguinte: escolhemos um nümero "c" e, seo 
número de caras está entre (n/2 — c) e (n/2 + c), aceitamos a hipótese nula, 
bem como concluímos que a moeda é honesta ou equilibrada; caso contrá- 


rio, dizemos que a moeda não é honesta. 


A região de (n/2 - c) a (n/2 + c) é denominada de região de aceitação e a região 
para a qual a hipótese nula será rejeitada é denominada de região de rejeição 
ou de região crítica (veja a ilustração a seguir). Mas o nosso problema conti- 
nua, pois não sabemos quão grande pode ser o valor de c. 


Região de aceitação 


ö n/2 a 
——————— ———————— 
Região de rejeição Região de rejeição 
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Š 
8 
8 
8 
$ 
i 
E 
E 
$ 
H 
à 
E 
E] 
E 
E 
EH 
8 
E 
E] 
E 
$ 
8 


Nenhuma parte desta 


Erros do tipo 1 e do tipo 2 


HA vÁRIAS FORMAS DE REALIZARMOS O TESTE DE HIPÓTESES. Entretanto, corre- 
mos o risco de rejeitar uma hipótese que é verdadeira ou de aceitá-la quando 
é falsa. Temos, portanto, dois tipos possíveis de erros que são representados 
no quadro a seguir. 


Aceita-se a hipótese nula (H ) | Rejeita-se a hipótese nula (H) 


H, é verdadeira. | Decisão foi correta. Erro do tipo 1. 


H, é falsa. Erro do tipo 2. Decisão foi correta. 


rt. 184 do Código Penal. 


Para melhor compreendermos esse quadro, voltemos ao caso, visto anterior- 


mente, da moeda. 


Nós sempre desejamos acertar ao fazermos um julgamento sobre nossa 
hipótese nula. Entretanto, só há duas maneiras de acertarmos: aceitando a 


hipótese nula, quando ela é verdadeira, ou rejeitando-a, quando ela é falsa. 
Logo há duas possibilidades de errarmos: 


rejeitando a hipótese nula, quando ela for verdadeira; 


ou aceitando-a, quando ela for falsa. 


Ao primeiro tipo de erro, denominamos de tipo 1; ao segundo tipo de erro, 
denominamos de tipo 2. 


Naturalmente, nós nos preocupamos mais com a possibilidade de rejeitar 
de forma equivocada a hipótese nula, ou seja, temos maior cuidado em evi- 


tar o erro do tipo 1. 


Normalmente, fixa-se um limite superior para a probabilidade de cometer- 
mos um erro do tipo 1. O valor mais comum para esse limite é de 5%, sendo 


que em alguns casos, aceita-se 10%. 
Nível de significância 


Nível de significância do teste é o nome dado à probabilidade de cometer- 
mos um erro do tipo 1. Dizemos, por exemplo, que o nosso teste de hipóte- 
ses está planejado com nível de significância igual a 5%. Vamos chamá-lo 
de a (alfa)* (no caso, a = 5%). 


* OL é a letra grega minúscula que lemos alfa e que corresponde à letra a do nosso alfabeto. 
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Observe que um erro do tipo 1 é, socialmente falando, mais importante que 
um erro do tipo 2. Vejamos alguns exemplos práticos de análise do nível de 
significância. 

Vamos, NESTA PRIMEIRA SITUAÇÃO, supor a decisão de aprovar ou reprovar 
um aluno na prova final. 


Aprovar o aluno Reprovar o aluno 
O aluno tirou nota mínima. Decisão correta. Erro do tipo 1. 
O aluno não tirou nota mínima. | Erro do tipo 2. Decisão correta. 


Agora, UMA SEGUNDA SITUAÇÃO: suponhamos que um médico precise decidir 


se vai ou não retirar um tumor benigno de um paciente. 


Opera o paciente | Não opera o paciente 


O paciente precisa ser operado. Decisão correta. | Erro do tipo 1. 


O paciente não precisa ser operado. | Erro do tipo 2. Decisão correta. 


Como chamamos de a (alfa) a probabilidade de cometer um erro do tipo 1, 
chamaremos de D (beta)* a probabilidade de cometer um erro do tipo 2. 


Região de rejeição e região de aceitação 
Para a análise da região de rejeição e da região de aceitação, precisamos 
fazer três considerações. 
a) Hy, parâmetro = x 
H: parâmetro > x 


NESSA PRIMEIRA CONSIDERAÇÃO, se uma amostra aleatória fornecer uma esti- 
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mativa menor ou igual a x, devemos aceitar a hipótese nula (H,). Caso H seja 


verdadeira, tomamos a decisão correta. Mas, se a amostra aleatória fornecer 


uma estimativa muito maior que x, provavelmente rejeitaremos H,. Assim, se 


Nenhuma parte desta 


a hipótese nula for verdadeira, teremos cometido um erro do tipo 1. 


Por exemplo, se y é a distribuição amostral do parâmetro, então a região de 
aceitação da hipótese nula é a região à esquerda de y e a região de rejeição é 
a região à direita de y, conforme ilustrado a seguir. 


* B é a letra grega minúscula que lemos beta e que corresponde à letra b do nosso alfabeto. 
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* y 


Região de aceitação Região de rejeição 


b) H; parâmetro = x 
H,: parámetro < x 


NESSA SEGUNDA CONSIDERAÇÃO, se uma amostra aleatória fornecer uma esti- 
mativa maior ou igual a x, devemos aceitar a hipótese nula (H,). Caso H, seja 
verdadeira, tomamos a decisão correta. Mas, se a amostra aleatória fornecer 
uma estimativa muito menor que x, provavelmente rejeitaremos H,. Assim, 


se a hipótese nula for verdadeira, teremos cometido um erro do tipo 1. 


Por exemplo, se y é a distribuição amostral do parâmetro, então a região de 
aceitação da hipótese nula é a região à direita de y e a região de rejeição é a 
região à esquerda de y, conforme ilustrado a seguir. 


y X 


Região de rejeição Região de aceitação 


c) Hy parâmetro =x 
H,: parâmetro 2 x 


NESSA TERCEIRA CONSIDERAÇÃO, se uma amostra aleatória fornecer uma es- 
timativa próxima a x, devemos aceitar a hipótese nula (H,). Caso H, seja 
verdadeira, tomamos a decisão correta. Mas, se a amostra aleatória fornecer 
uma estimativa ou muito maior que x ou muito menor que x, provavelmen- 
te rejeitaremos H,. Assim, se a hipótese nula for verdadeira, teremos come- 


tido um erro do tipo 1. 
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Por exemplo, se y, ou y, é a distribuição amostral do parâmetro, então a região 
de aceitação da hipótese nula é a região à esquerda de y, ou à direita de y, 
conforme ilustrado a seguir. 


0/2 a/2 


yı ^ y; 


Região Região Região 
de rejeição de aceitação de rejeição 


Etapas de um teste de hipóteses 


Para qualquer teste de hipóteses, devemos observar as seguintes etapas: 


a) enunciar a hipótese a ser testada (H,) e enunciar qual a hipótese 


alternativa (H,); 
b) a partir de H, definir o tipo de teste que será usado para testar H; 


c) fixar o limite de erro (o), ou seja, fixar a probabilidade de cometer-se 
um erro do tipo 1; 


d) determinar a região de rejeição e a região de aceitação; 


e) com os elementos amostrais, calcular o estimador e verificar se ele 


se encontra ou na região de rejeição ou na região de aceitação; 


f) decidir, se o estimador estiver na região de aceitação, aceitar H; se 


o estimador estiver na região de rejeição, rejeitar H,. 


Caso não conheçamos o (desvio padrão populacional), usaremos S (desvio 
padrão amostral). 


Teste para médias 


Um ótimo estimador para a média populacional (p) é a média amostral (X). 


A distribuição amostral das médias é normal, com: 


em que Z, é denominado teste Z de uma amostra. 
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VAMOS ANALISAR UM EXEMPLO DE DISTRIBUIÇÃO AMOSTRAL DE MÉDIAS 
Primeiramente analisaremos a situação. 

Hy;p-x 

H:u>x 


Suponhamos uma amostra aleatória de 100 elementos, com média igual a 
70, retirados de uma população normal com desvio padrão o = 5. Conside- 
rando-se um nível de significância de 5%, teste a hipótese de que a média 
populacional (u) seja igual a 69. Suponha a hipótese alternativa | > 69. 


VAMOS DETERMINAR A REGIÃO DE REJEIÇÃO PARA O = 5%. 


Consultando a tabela 35 do capítulo 10, verificamos que, para 5% temos z = 1,65, 
ou seja, 50% — 5% = 45% = 0,45. 


Vamos, agora, determinar z para a região de rejeição (z ). 


70 — 69 
WS 
100 
1 
Z-—— 
5 
10 
Z=2 


VERIFICAMOS QUE O VALOR DE Z, ESTÁ NA REGIÃO DE REJEIÇÃO PARA A HIPÓTESE 


NULA, POIS Z. > 1,65. PORTANTO, A HIPÓTESE NULA SERÁ REJEITADA. 


fL. "Exercícios Resolvidos 
L Hex 
H:u<x 


Suponhamos uma amostra aleatória de 81 elementos, com média igual a 
92, retirados de uma população normal com desvio padrão o = 5. Consi- 
derando um nível de significância de 10%, teste a hipótese de que a média 
populacional (u) seja igual a 93. Suponha a hipótese alternativa u « 93. 
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VAMOS DETERMINAR A REGIÃO DE REJEIÇÃO PARA 0. = 10%. 


Consultando a tabela 35 do capítulo 10, verificamos que, para 10%, temos 
z = — 1,28, ou seja: 50% - 10% = 40% = — 0,40. 


Vamos agora determinar z para a região de rejeição (Z ). 


|| 92-98 
" 5 
N81 
-1 
ZE 
05. 
9 
Z,=-1,80 


VERIFICAMOS QUE O VALOR DE Z. ESTÁ NA REGIÃO DE REJEIÇÃO PARA A HIPÓTESE 


NULA, UMA VEZ QUE Z. « —1,28. PORTANTO, A HIPÓTESE NULA SERÁ REJEITADA. 
2. Hi;p-x 

H:u>x 
Suponhamos uma amostra aleatória de 144 elementos, com média igual a 
68, retirados de uma população normal com desvio padrão o = 8. Nesse caso, 


considerando um nível de significância de 5%, teste a hipótese de que a mé- 
dia populacional (u) seja igual a 67. Suponha a hipótese alternativa u > 67. 


VAMOS DETERMINAR A REGIÃO DE REJEIÇÃO PARA Q = 5%. 


Consultando a tabela 35 do capítulo 10, verificamos que, para 5%, temos z = 1,65, 
ou seja, 50% — 5% = 45% = 0,45. 


Vamos agora determinar z para a região de rejeição (Zr). 


|| 68-67 
i 8 
N14 
1 
Yom 
Za ^ 
12 
Z,=1,5 


lora Ibpex. A violação dos dire 


VERIFICAMOS QUE O VALOR DE Z. ESTÁ NA REGIÃO DE ACEITAÇÃO PARA A HIPÓTE- 


SE NULA, POIS Z. < 1,65. PORTANTO, A HIPÓTESE NULA SERÁ ACEITA. 


Sintese 


Uma vez que consideramos ser uma hipótese estatística uma suposição 
quanto ao valor de um parâmetro populacional, vimos, neste capítulo, que 
utilizamos o teste de hipóteses por ser uma técnica que nos possibilita acei- 
tar ou rejeitar a hipótese estatística a partir dos dados da amostra dessa po- 
pulação. E, para realizarmos esse processo, precisamos de clareza quanto 
ao que seja: 


e Hipótese nula e hipótese alternativa 

e Erros do tipo 1 e do tipo 2 

e Nível de significância 

e Região de rejeição e região de aceitação 
e Etapas de um teste de hipóteses 

e Teste para médias 


Assim, conceituamos todos esses aspectos, para em seguida aplicá-los em 
situações concretas que os habilitam para realizar uma inferência estatísti- 


ca: o teste de hipóteses. 
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At Questões para revisão 


Marque a alternativa correta nos exercícios a seguir. 


T; 


3: 


Temos uma amostra aleatória de 64 elementos, com média igual a 50, 
retirados de uma população normal com desvio padrão o = 6. Conside- 
rando um nível de significância de 5%, teste a hipótese de que a média 
populacional (u) seja igual a 52, sendo a hipótese alternativa u < 52. 


( ) z, 7 1,65 e está na região de aceitação. 

( ) z,* - 1,65 e está na região de aceitação. 

( ) z, * 2,67 e está na região de aceitação. 

( ) z, * - 2,67 e está na região de rejeição. 

( ) z, 7 — 1,65 e está na região de rejeição. 

Termos uma amostra aleatória de 100 elementos, com média igual a 88, 
retirados de uma população normal com desvio padrão o = 20. Conside- 


rando um nível de significância de 5%, teste a hipótese de que a média 
populacional (u) seja igual a 85, sendo a hipótese alternativa u > 85. 


()z,=- 1,65 e está na região de rejeição. 

( ) z,* - 1,5 e está na região de rejeição. 

( ) z,=1,5e está na região de aceitação. 

( ) z,*- 1,5 e está na região de aceitação. 

( ) z,=1,5e está na região de rejeição. 

Temos um empacotador automático de café que funciona de maneira 
que a quantidade de café em cada pacote de 500 gramas tenha uma 
distribuição normal com variância igual a 25. Considerando um nível 
de significância de 5%, teste a hipótese de que a média p seja igual a 


500, sendo a hipótese alternativa u > 500. Foram dadas dez amostras 
com os seguintes pesos: 508, 510, 494, 500, 505, 511, 508, 499, 496, 489. 
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( ) A hipótese que | = 500 é aceita, pois z, « 1,65. 

( ) A hipótese que | = 500 é rejeitada, pois z, « 1,65. 

( ) A hipótese que | = 500 é aceita, pois z, > 1,65. 

( ) A hipótese que u = 500 é rejeitada, pois z, > 1,65. 

L ) A hipótese que u = 500 é rejeitada, pois z, = 1,65. 

Temos uma amostra aleatória de 40 elementos, com média igual a 100, 
retirados de uma população normal com desvio padrão o = 12. Conside- 


rando um nível de significância de 10%, teste a hipótese de que a média 
populacional (u) seja igual a 102, sendo a hipótese alternativa u < 102. 


( ) A hipótese nula será rejeitada, porque Z, está na região de aceitação. 

( ) A hipótese nula será rejeitada, porque Z, está na região de rejeição. 

( ) A hipótese nula será aceita, porque Z, está na região de aceitação. 

( ) A hipótese nula será aceita, porque Z, está na região de rejeição. 

( ) A hipótese nula será rejeitada, porque não se pode determinar Z. 
Temos uma amostra aleatória de 30 elementos, com média igual a 48, 
retirados de uma população normal com desvio padrão o = 10. Conside- 


rando um nível de significância de 10%, teste a hipótese de que a média 
populacional (u) seja igual a 46, sendo a hipótese alternativa u > 46. 


( ) A hipótese nula será rejeitada, porque Z, está na região de aceitação. 
( ) A hipótese nula será rejeitada, porque Z, está na região de rejeição. 
( ) A hipótese nula será aceita, porque Z, está na região de aceitação. 
( ) A hipótese nula será aceita, porque Z, está na região de rejeição. 


( ) A hipótese nula será rejeitada, porque não se pode determinar Z. 


O que é uma hipótese nula e uma hipótese alternativa? 


O que significa no teste de hipóteses “nível de significância”? 
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o[njrde»: 


1 | 
Tu 
Análise da variância (Anova) 


Conteúdos do capítulo 


e Conceituação do método de cálculo da variância - Anova 
e Aplicação da Anova em situações práticas 


Após o estudo deste capítulo, você será capaz de: 


1. conceituar o método de variância — Anova; 


2. aplicar o cálculo de variância em situações práticas. 


Já estudamos no teste de hipóteses como verificar a igualdade entre duas 
médias. Entretanto, se precisarmos comparar três ou mais médias, simul- 
taneamente, a comparação das mesmas, duas a duas, seria um trabalho 
pouco eficiente. 


Para solucionar esse problema, Fisher* criou a denominada Análise da 
Variância (abreviadamente, Anova = Analysis of Variance), que nos permite 


comparar, simultaneamente, as médias de várias amostras, desde que: 


a) tais amostras tenham sido extraídas de populações que têm distribuição 
normal; 


b) as populações tenham o mesmo valor de variância; 
c) tais amostras sejam aleatórias e independentes. 


O método de análise da variância consiste em dividir a variância em com- 
ponentes úteis. O modelo mais simples de Anova é aquele em que obser- 


varemos os grupos considerando uma única propriedade. 


Suponhamos que desejamos analisar as médias obtidas em Estatística pe- 
los alunos de três diferentes localidades que assistem às aulas na modali- 
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VAMOS, ENTÃO, CONSIDERAR OS SEGUINTES RESULTADOS AMOSTRAIS: 
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LocaLiDaDE ÀA:8-7-8-6-9-7-6-7-8-9 


LocaLiDaDE B:6-7-8-6-7-9-9-8-7-8 
LocaziDaDE C:7,5-6-6-65-7,5-6-5,5-8-8-7 


Ao calcularmos as médias dessas três localidades, encontramos, respectiva- 


mente, 


* Ronald Aylmer Fisher (1890 — 1962) foi um estatístico, biólogo evolutivo e geneticista inglés. 


L 
X,-77,3; 
X.-68 


O QUE DESEJAMOS SABER É SE ESSAS DIFERENÇAS ENTRE AS MÉDIAS SÃO SIGNIFI- 


CANTES OU SE PODEM SER ATRIBUÍDAS AO ACASO. 
Chamaremos, então, de: 

u, a média da localidade A, 

H, a média da localidade B e 

Hc a média da localidade C. 
Vamos testar a hipótese nula (H,) que u, = u, = He 


A hipótese alternativa (H,) afirma que as médias não são iguais (pelo 


menos duas são diferentes). 


Se após o teste rejeitarmos H,, concluímos que a propriedade considerada 
tem influéncia sobre a variável em análise. Lembrar que o teste leva em 


consideração determinado nível de significância (por exemplo, a = 5%). 


O PRIMEIRO PASSO É CALCULARMOS AS MÉDIAS DE CADA AMOSTRA, à que cha- 


maremos X,, X, e X,, respectivamente. 


Se X, X, e X, estiverem próximas, tendemos a aceitar H, como verdadeira, 


ou seja, u, = Hp = He 


Assim, O SEGUNDO PASSO É DETERMINAR A MÉDIA TOTAL (média das médias 
F 
pela fórmula: 


X, tX tXo 7547368 


m 3 


X= 72 


A variância da amostra, para as trés médias, será obtida pela fórmula: 


XX * (S — Xy * (X-- X 


m-1 


Sg 


= (7,5 -7,2} + (7,3 - 7,2} + (6,8 - 7,2)? 
2 


" 0,09 + 0,01 0,25 
2 


70,175 
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CALCULAMOS, NA SEQUÉNCIA, A VARIÂNCIA AMOSTRAL PARA CADA GRUPO DE 


RESULTADOS. 

X, X, X. (X,-X | 0QG-Xy | (X.-X 
8 6 7,5 0,25 1,69 0,49 
7 7 6 0,25 0,09 0,64 
8 8 6 0,25 0,49 0,64 
6 6 6,5 2,25 1,69 0,09 
9 7 7,5 2,25 0,09 0,49 
7 7 6 0,25 0,09 0,64 
6 9 55 2,25 2,89 1,69 
7 8 8 0,25 0,49 1,44 
8 7 8 0,25 0,49 1,44 
9 8 7 2,25 0,49 0,04 
L=75 L=73 L=68 L=10,5 L=81 L=76 

T £ n 10.5 T 

E(X-X 81 
p= =— -0,90 
n-1 9 
2 
is XX. x 76 |y 


n-1 9 


Então, a média dessas variâncias amostrais é igual a: 


S S+S +S 1,17 +0,90 + 0,84 


0,97 
m 3 


Quanto maiores forem S,? , S; e Sẹ, maior a probabilidade de X, , X, e X. 
serem diferentes. Logo, quanto maior for S", maior a chance de aceitarmos H. 


Agora que conhecemos a variância da amostra para as trés médias (S?) ea 
média das trés variâncias amostrais (S?), PODEMOS CALCULAR A DENOMINADA 
distribuição F (em homenagem a Fisher), pela fórmula: 


n: S2 
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No nosso exemplo, 


10.0,175 
F = ——— -1,80 
0,97 
APÓS A DETERMINAÇÃO DO VALOR DE F, precisamos consultar a tabela 37 para 
encontrar o valor crítico de uma distribuição F. Caso o valor observado seja 


maior que o valor crítico, rejeitaremos H, e, caso contrário, aceitaremos H,. 


Verifique na tabela que, como n = 10 (ọ,) e m= 3 (o), temos, na tabela 37, o 


resultado 3,71 (esse é o valor crítico). Como F - 1,80 para o nosso exemplo, 


aceitaremos H.. 


Tanto S? quanto S? são estimativas não tendenciosas de o? quando H, é 
verdadeira. Logo, sào valores que tendem a ser iguais, o que faz com que F 
se aproxime de 1. Quando H, nào é verdadeira, F assumirá um valor bem 


maior que 1. 


Resumindo, caso as médias sejam realmente iguais, F se aproxima de 1. 


Caso F seja muito maior que 1, rejeitaremos H. 


235 


Z 
Š 
8 
8 
8 
$ 
i 
E 
E 
$ 
H 
à 
E 
E] 
E 
E 
E 
8 
i 
E] 
E 
$ 
E 


Nenhuma parte desta 


leuad oBpoo op pgi "Ve ojad opiund à 8661/0196! 187 eu opoejeqejse euro & sreiojne SOJBI!P sop ogóep v 790 eiop3 ep oesezuojne eaud e was euo no OI Jenbfenb Jod epznpoidai jes eiapod ogôeoyqnd siap aped euinuuev 


00T| CUT) TET) 6€'| T| TST] LST) O9'I| CIT] Z9'| 69'I| GZ'I| €8T| 88T| ve'l| IO'c| Ol'c| Ic'c| Zt'c| O9'c| ooe) tec o 
SUL) SET) EVI) OST| SS'I) I9'I| 99'1| 697) UT SLI) ZH EST] 161) 961| zoz) 60T| Zl'c| 6cc| szej 897| Z0'€| zeel oci 
6ET| Zv'I| EST) 6ST| S9T| OLT| SU S4T| I8T| PRU 98T| T6T| 661| vO'c| Ol'c| zI] acc] Z€'c| ccc 9/c| SUE) 00%) 09 
IST| SS'I| PIT] 69'1| vZ'I| 6Z'1| F8T| 48T| 061] Z6T| S6T| 00T| 807| cl'c| SIc| sez) v€'c| swz) I9T| v9'c| ecel so] UP 
c9'| S9'I| PL'I) 641] PRU 68'1| €C6T| 961| 66'1| IOT| vO'c| 60'c| T| Ic'c| Zcc| cet] PE esc] 697| cóc cee) LF] 0€ 
v9'I| OZ'| SZ'TI| IS'I| S8T| 061 Tat 46T) Io'c| eoz| SOT| Ol'c| srz) ccc| Scc Set] erT| ssel OZc| €oc| ce€| SIT] 6c 
S9'| 141) 2/71] T81| Z8' | 167] 96T) 661| cO'c| toz) 90'7| z| 6l'c| pot] 6cc| 9c'c| svel 9c'c| IZc| s6z| PEE] Ocv| Sc 
L9'1| CLT) BU PRU SS' l| €6T| 267] OO0'c| vO'c| 90'c| soz| erz| Occ| Scc, regj) Let] z) zsz) elt| 967| RKE Icv|  Zc 
69'| SZ'I| OST| S8T| O6'TI| S6T| 66'| cO'c| SO'c| Z0'z| 60'c| SIT) ccc) Zcc, TET) BEE Lv'c| 6ST| TEI 86c| Leej Cr) 9c 
LU ZZT| RU 48I) T6T| 96T) IO'c| vO'c| Z0'c| 60T| ITT) IT| PET| Scc, vet] OT) T| 097| AT) 667| 6cc| Por) RC 
SU 64T| PRU 68' | F6T| S6T| eoz) SO'T| 60'c| IIT| elt| SIT] Scc) Ot, 9€c| FEl Isc) vc] REl LET ovej 9cv| vc 
9/1| I8T| 98T) I6'| 961| Ie) SO'c| S0'c| t| €l'c| SUl ocz) Zcc| cec zec) aj escl v9'c| Os'c| KUE] PE] sur)  €c 
SRCU Y8T| 68'1| v6'| 861| COT| Z0'c| Ol'T| €r'c| SIT| ZUI cut] Ot'c| PEZ ovci 9v'c| ssel 99| cs'c| soel ej oet) cc 
IS'I| Z8' 1| T6T| 96 | Ie soz) Ol'c| ziz) 9l'c| Sel ocz) Scc| KE zez) cvc| ov'c| REl 897| ve'c| L0€| FEI cer) Ic 
vS'1| 06'| S6T| 66'| POT| S0'c| TIET) SIT| SIZ) Occ| ccc| Scc| SET) 6€T| REl IS'c| 097| IZZ) Z8'c| UUE] 6v€| scev| oz 
88' l| €6T| 86T| €OT| Z0'c| Il'c| 9IT| Sl'c| ccc| ETT) 9cc| IET) 8ET| crc, RFC PST) EIT) vZc| 067| clc| REI ser) 61 
261, 461) zoz) 907, LEI SIT] 6rz| ccc, Scc| Zcc| 6cc| rec] twe) 9v'c| IST) s9T| 99T) ZZc| cóc, 9l'€| SSE) IvTv| SI 
96'1| I0'c| 90'z| orz) SUE 6l'c| ece) el 6cc| Iet| vt'c| REl SEL BEE SSc) I9T| O0Z'c| IS'c| 967| Oct| 6s'ej ST) ZI 
LUZ) 90T| Il'c| stj el'c| vcc| Scc| UE KK] sez| KE cvc| ovc| vet] 6ST| 99'7| Laj ss'c| WE] vcc| c9'€| ovv| 9I 
L0c, Ilc| 917| ocz) Scc| ece) KE sezi eez) Orc coz) srt] vet) BREl v9'c| IZc| G6Zc| 067] 90€| ócc| s9c| rot) GI 
elc| SIT| ccc| Zcc| Iez) SeT) 6€c| lv'c| zj 9v'c| SEI esz) 09'c| SIT) OLT) AT) S87) 96T| Tel PEI PEI 097) pL 
IZZ) Sec) OET| PET| SET| cvc| 9v'c| REl ce'c| KRE SRL 0907| LIT TALT ZZc| est] cóc KUE sIC| Iv'c| IS'€| Z9Tv| €I 
Ot'c| PET| SET| €v'c| Zvc| IRE PST) LIT) 09T) co'c| v9'c| 69T| REl UR S8T| I6'c| 00€| tej 9c€| BPE] 68€| GZT| a 
Or'c| Sr'c| 6v'c| EST| LST) I9T| SIT) LIT) OLT) cZc| vZc| ecel SS'c| 067] S6T| I0€| 60€] Occ| gee) 6s'e| 86€| vST| LL 
FSC REl c9'c| 99'c| OZ'c| vZc| Lit) OS'c| est] S8T| 48z| l6'c| S6T| c0€| Z0€| YUS] ceel eee) sv'c| IZ€| OIT] 96%) OI 
IZc| SLT) 6/c| egz) 98'c| 06T| v6'c| 967| 6ó'c| I0'c| eoʻe| zoe) ref srel ezej occ| zeel REI egel 98'e) 9cv| ZUR 6 
€67| L6T| I0€| PUS] so'e) ZUR) SUS] ZUR) Occ| zeel yeej REI sec] octc| trel Oc't| sec) 69'€| vs'c| Z0'v| 9v'Tv| KS 8 
€ct| zeel oe'e| TE] SEI trej E] FEI PEI LRE] esc) REI PEI so't| ELE) o/c| L8€| Z6€c| clv| SeT| PPI 64 4 
L9'€| OZ€| vZ€| KI IS€| REI ZS8'c| 06€| toc) voc| 96€| 00T| SO0T| OIT| RTP IcT| SCTv| 6€T| ESP) O9ZT| VI'S| 66'S 9 
9€v| t| FP 9vv| OST| ERT 9c'v| Sc'T| 09| c9v| v9T| S9T| vZTv| ZZYv| RTI SST| S6T| RUS 6rs| Sl 645] 199 S 
e9's| 99G| 696) ZRI sz's| SI URS cS'c| vs'a| 98'S] Z8'S| t6's| 96's| 009] v0/'9| 609]  91'9| 979) 6t'9  6G'90| +69) LL T 
€c'8| cc'9| Zc'8| 658] 798| V98| 998| 498| 698| OZ/'8| 291 v//9| 648| 188| 988| 688| vo'S| 106| cl 6| 876| SGc'6| ETOL € 
OS'6I| 6P'6I| SP/GI| ret grel SYet GP'GI| Yet CP/OI| EV'6I| Yet Yel Yet SE6L| LE6I| G€'6I| CE'6T| OC'GI| Gc'6I| 9T'6I| 0061| IG'SI S 
0€'vSc 0€ esc 0c cac [OTTS 10 LRS |S0'6vc | cO 8vc | O£^Zvc OSIE 1 86 SFC UF SEZ | 06'€vc |88 LEZ | VG Orc |88/8€c |ZZ9€c 166 ccc |9l'O€c [SOFT | IZSIT | 0S 661| Sh'L9T I 
æj Ol) 09] OF] 0€| Fel O] SI) 91] ST a) al OI 6 8 Z 9 S T € Z I 
( b) 4 op 1opeouinu op opepuoqi] op nero d 


H 9 %S 9p soonro sao[eA — ZE ejaqer, 


Obs.: q, é o grau de liberdade do denominador de F 


a — 596 = 0,05 


à ES 


Ferítico para a 7 576 


VARIÂNCIA TOTAL é aquela que se obtém quando as m amostras são reuni- 
das de modo a constituir uma única, composta da soma de todos os seus 
elementos. 


VARIÂNCIA ENTRE AS AMOSTRAS mede a variação existente entre todas as m 
amostras que são reunidas. 


VARIÂNCIA DENTRO DAS AMOSTRAS mede a variância dentro das n amostras 
tomadas em conjunto. 


Se compararmos as médias de m amostras aleatórias de tamanho n, os 
graus de liberdade do denominador e do numerador são, respectivamente, 
m-lem(n-1). 


TV. C Exercício Resolvido 


Voltemos ao nosso exemplo anterior. Tínhamos m = 3 amostras e n= 10 


elementos por amostra. 


Então, temos, para a estatística F, 2 graus de liberdade para o numerador 
e 27 graus de liberdade para o denominador. Consultando a Tabela 37, te- 
remos que a estatística F tem 95% de chance de ser menor do que 3,35. 


Resposta: Como O VALOR ENCONTRADO FOI MENOR QUE 3,35, ACEITAREMOS A 
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HIPÓTESE NULA (Hy). 
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Sintese 


Como vimos, o método de análise da variância consiste em dividir a variân- 
cia em componentes úteis. O modelo mais simples de Anova (Analysis 
of Variance) é aquele em que observamos os grupos considerando uma úni- 
ca propriedade, pois a aplicação desse método visa justamente possibili- 
tar que façamos a comparação simultânea de várias médias de amostras. 
Nesse caso, denominamos a análise de distribuição de F, pois o método 


com essa finalidade foi criado por Fischer. - 
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TL 


1. 


a) 
b) 


Questões para revisão 


Quais os graus de liberdade para o numerador e para o denomina- 
dor da distribuição F, considerando-se que compararemos as médias 
de 5 amostras aleatórias que possuem, cada uma, 12 elementos? 


Um trabalhador de uma indústria produz determinada peça utili- 
zando três diferentes máquinas. Produziu, em cada máquina, cinco 


peças e anotou o tempo gasto para cada uma, em segundos: 
Máquina A: 90 - 92 - 89 - 90 — 89 

Máquina B: 88 - 87 - 90 - 91 — 89 

Maquina C: 92 - 91 - 88 - 89 - 95 

Pergunta-se: 

a hipótese nula poderá ser rejeitada? 


sendo os dados fornecidos amostras aleatórias de populações nor- 
mais e com o mesmo desvio padrão, as diferenças entre as três mé- 
dias podem ser atribuídas ao acaso (faça o teste com 0.05 de nível de 
significância)? 


3. Assinale as alternativas corretas. 


SÃO CONDIÇÕES PARA A APLICAÇÃO DA ANÁLISE DA VARIÂNCIA: 


a. 


as amostras originarem-se em populações que têm distribuição 
anormal; 


as amostras originarem-se em populações com distribuição normal; 
o valor da variância ser o mesmo nas populações observadas; 


a situação de dependência das amostras em relação a inferência feita. 


Nenhuma parte desta publicação poderá ser reproduzida por qualquer meio ou forma sem a prévia autorização da Editora Ibpex. A violação dos direitos autorais é crime estabelecido na Lei nº 9610/1998 e punido pelo art. 184 do Código Penal. 


4. 


~ 


~ 


~ 


Assinale (V) para as assertivas verdadeiras e (F) para as falsas. 


) Constitui-se uma sequência de passos para a análise de variância: 
cálculo da média de cada amostra; determinação da média total; cál- 


culo da variância amostral para cada grupo de resultados. 
) A distribuição F é calculada após a média das variâncias amostrais. 


) Usamos a distribuição F para verificarmos a igualdade entre duas 


médias. 


) Fischer foi quem criou a Anova (Analysis of Variance) com o objetivo 
de estabelecer paralelos entre amostras aleatórias e independentes. 


Assinale a alternativa correta. A variância pode ser: 
apenas variância total. 

unicamente a variância entre as amostras. 
considerada sempre variância dentro das amostras. 


variância total, variância entre as amostras e variância dentro das 


amostras. 
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/ Para concluir 


Mário Quintana não era um estudioso de estatística, pelo menos não que 
se saiba. Mas foi de tal modo minucioso e atento que podemos até dizer ter 
ele muitas vezes perscrutado a estatística do insondável em seus poemas. 
Naturalmente, essa aplicação estatística pertence unicamente aos poetas. 
Mas que ele tinha uma consciência do fazer, da aplicação estatística, tinha. 
Veja o que ele afirmou em As Indagações: “A resposta certa, não importa 
nada: o essencial é que as perguntas estejam certas”. 


Sim, isso é primordial, ao aplicarmos os parâmetros estatísticos, PRECISA- 
MOS SABER OBJETIVAMENTE O QUE QUEREMOS MEDIR. Esse é 0 princípio bási- 
co. Obviamente, como não somos poetas, as respostas devem conter uma 


margem de erro mínima. Aliás, considerando a aplicação da estatística no 
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desenvolvimento das ciências, devemos destacar que não é suficiente ob- 


servar os fenômenos, faz-se necessário o estudo de suas causas. E nesse 
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processo que a estatística tornou-se uma ferramenta preciosa na pesquisa 
de casualidade que há entre os fenômenos. Atualmente, ela, a Estatística, 
apresenta-se como indispensável nos planejamentos, bem como na cole- 
ta, descrição, análise e organização das informações e dos conhecimentos. 
Assim, tornou-se uma ciência necessária em várias áreas das diversas ciên- 
cias, e certamente em sua área de estudos ou atuação, não importa qual 
seja, ela também está presente, o que explica a importância de estudar a 
aplicação de métodos estatísticos para o seu aprimoramento profissional. 
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V Respostas 


Capítulo 1 


T 


Resposta possível: População é o conjunto de elementos que deseja- 


mos observar para obter determinada informação. 


2. Resposta possível: Amostra é o subconjunto de elementos retirados da 
população que se está observando. 

3. b 

4 c 

5 EERVF 

Capítulo 2 

0 7 

2. Cronológica 

3. 5 

4. Resposta possível: O gráfico aqui apresentado é o denominado gráfico 
de colunas. 

5. Resposta possível: As partes que constituem uma tabela são o cabeça- 
lho, o corpo e o rodapé. 

Capítulo 3 

1. 6 

2. 60 

3. 8 

4. 2 

b. 9 

6 VEEEV 

7. Resposta possível: Enquanto a variável qualitativa descreve qualidades, 


a variável quantitativa é expressa por meio de valores numéricos. 
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8. Resposta possível: Ela é uma série estatística específica caracterizada 
pelo fato de seus dados serem dispostos em classes, com suas respec- 
tivas frequéncias absolutas. 


Capítulo 4 
1. 47 
2. R$830,40 


7 


3 
4. R$824,00 


5. R$828,00 i 
6. 30 i 
7. 55 : 
8. 15 : 
9. 146 : 
10. 440,00 


11. Resposta possível: As medidas de posição servem para resumir os da- 
dos, apresentando um ou mais valores da série estudada. 


12. Resposta possível: A média aritmética simples é utilizada para dados 
não agrupados e a média aritmética ponderada para dados agrupados, 
onde cada grandeza envolvida no cálculo da média tem diferente peso. 


Capítulo 5 


dia 2 


Nenhuma parte desta publicação poderá ser reproduzida por qualquer meio ou forma sem a prévia autorização da Editora Ibpex. A violação dos direto 


y 90 B Q 
M 


oo 
N 
=] 
oo 


248 


9. Resposta possível: As medidas de dispersão são utilizadas para verifi- 
car o quanto os valores encontrados em uma pesquisa estão afastados 
ou dispersos em relação à média ou a em relação à mediana. 

10. Resposta possível: As medidas de dispersão são: amplitude total ou 
intervalo total; amplitude semi-interquartílica, ou intervalo semi-inter- 
quartílico, ou desvio quartil; desvio médio; variância; e desvio padrão. 

Capítulo 6 

1. -0,20 

2. 0,30 

3. platicürtica, com K = 0,333 

4. platicürtica 

5. simétrica 

6. Resposta possível: Elas indicam o grau de deformação de uma curva 
de frequências. 

7. Resposta possível: Elas indicam o quanto uma distribuição de fre- 


quências é mais achatada ou mais afilada do que uma curva padrão, a 


qual é denominada de curva normal. 


Capítulo 7 


Ha 


Ae œ 


10. 
11. 


10/18 
1/2 
4/16 
16/52 
55/100 
76% 
5% 
284/3000 
8/720 
9/20 
38/100 
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12. 0,16% 

13. Resposta possível: A estatística baseia-se em experimentos. O cálculo 
de probabilidades, por sua vez, baseia-se em postulados lógicos. 

14. Resposta possível: Os fenómenos estudados em estatística sáo fenóme- 
nos cujos resultados apresentam variações de uma observação para ou- 
tra, dificultando dessa maneira a previsão de um resultado futuro. 

Capítulo 8 

1. 43,05% 

2. 19,37% 

3. 14,68% 

4. 9,375% 

5. 26,68% 

6. Resposta possível: É um modelo matemático para a distribuição real 
de frequências. 

7. Resposta possível: Na variável aleatória, os valores são determinados 
por processos ocasionais, aqueles que ocorrem fora do nosso contro- 
le como observadores. Ela pode ser discreta ou contínua. Quando se 
trata de uma variável aleatória discreta, podemos relacionar todos os 
possíveis valores em uma tabela com as respectivas probabilidades. 
Quando for uma variável contínua, não podemos listar todos os possí- 
veis valores fracionários e teremos que retratar as probabilidades por 
meio de uma função densidade ou por uma curva de probabilidade. 

Capítulo 9 

1. 27,068% 

2. 613% 

3. 2,90% 

4. 14,66% 

5. 4,46% 
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6. Resposta possível: Utilizamos a distribuição de Poisson para deter- 
minar a probabilidade de um dado número de sucessos quando os 
eventos ocorrem em um contínuum de tempo ou espaço. 

7. Resposta possível: Somente um. Ou seja, o número médio de sucessos 
para a específica dimensão de interesse. 

Capítulo 10 

1. 20 alunos 

2. 68,2696 

3. 15,8796 

4. 77,596 
92,7096 

6. 2,2896 

7. 30,8596 

8. 545 

9. 93,32% 

10. 31,7496 

11. Resposta possível: Uma variável aleatória contínua caracteriza-se pelo 
fato de possuir a condicáo de assumir qualquer valor real (inteiro ou 
fracionário) dentro de um intervalo definido de valores. 

12. Resposta possível: Ela caracteriza-se como uma distribuição de proba- 
bilidade contínua. O seu aspecto diferencial está no fato de ser simé- 
trica em relação à média e mesocúrtica e assíntota em relação ao eixo 
das abscissas, em ambas as direções. 

Capítulo 11 

1. X=n=12 
S?-2n-24 
S = 4,89898 

2. k=13,675 

3. k= 0,975 - 0,025 = 0,950 ou 95% 
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5. k-56,369 
6. b 

7. b 
Capítulo 12 


1. IC (67,38 < p < 68,62) = 9096. 
2. IC (159 < u < 165) = 95%. 


S 


IC (56,29 < u < 70,25) = 99%. 


= 


IC (60,10 < p < 66,44) = 75,80%. 
IC (1780 < u < 1900) = 95%. 


6. Resposta possível: A inferência estatística compreende uma sequência 
de procedimentos probabilísticos, em que estão inclusos o de amos- 


tragem, estimação e aplicação do intervalo de confiança. 


7. Resposta possível: São valores obtidos através de observações de uma 
amostra que utilizamos para determinar um intervalo de modo que 
haja a probabilidade de tal intervalo conter o valor desconhecido de 


um parâmetro que buscamos. 


Capítulo 13 


1. z,=-2,67 e está na zona de rejeição. 

2. z,=1,5e está na zona de aceitação. 

A hipótese que u = 500 é aceita, pois z « 1,65. 

A hipótese nula será aceita porque z, está na zona de aceitação. 


A hipótese nula será aceita porque z, está na zona de aceitação. 


o^ a e 9 


Resposta possível: Hipótese nula é justamente a informação ou hipó- 
tese que será testada (H,), enquanto a hipótese alternativa é aquela 
que afirma ser a hipótese nula falsa. A primeira (a nula) representa 
uma igualdade e a segunda (a alternativa) uma desigualdade. 
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7. Resposta possível: Recebe o nome de nível de significância a probabili- 
dade de cometermos o erro de rejeitar a hipótese nula quando ela for 
verdadeira. 


Capítulo 14 
1. Numerador = grau de liberdade igual a 55. 
Denominador = grau de liberdade igual a 4. 


2) a) Não, pois F =1,11. 
b) Sim, podem ser atribuídas ao acaso. 


3. bc 
4. VVEF 
5. d 
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